~正規分布するデータであれば1標準偏差の範囲に68.26%のデータが含まれるのはなぜか?~
統計学の入門書には、正規分布を仮定すると、
(1)1標準偏差の範囲(μ-σからμ+σ)に68.26%のデータが含まれる。
(2)2標準偏差の範囲(μ-2σからμ+2σ)に95.44%のデータが含まれる。
(3)3標準偏差の範囲(μ-3σからμ+3σ)に99.74%のデータが含まれる。
ということが当たり前のように書かれているので、何度も読んでいるうちに当たり前のような気分になりますが、改めてその理由を考えてみてすぐに答えが思い浮かばなかったので、少し考えてみました。
冒頭の疑問に対する答えは、『正規分布の確率密度関数を1標準偏差(μ-σからμ+σ)の範囲で積分すると0.6826になるから』ということになると思います。
標準正規分布(μ=0、σ=1)だと次の積分計算をすることになりますが、どうやらこの計算は一筋縄ではいかないようです。
置換積分や部分積分を使えば計算できるようにも思ってしまいますが、変なチャレンジ精神を発揮してえらい目にあうのもいやなのでやめときます。
どうりで、いろいろ調べてもこの積分の計算過程を書いた資料にたどり着かないわけです。
「だから正規分布表というものがあって、紙がもったいないのにどの入門書にも付いてるのか!」と改めて納得しつつも、「じゃあ、この表の数値はどうやって計算したんだ?」という新たな疑問もわいてきます。
ただ、今のところそこまで調べるエネルギーもありませんので、こちらも早々にあきらめようと思います。