(その1)で標準化量Z、(その2)で標準偏差σを扱ったので、
Z=(x-x0)/σ
の見方が変わったのではないだろうか。
分子で平均とのズレを、分母でズレの基準をつくったわけだ。
Zをxについて解くと、x=x0+σZとなる。中1の数学の等式変形だ。ここまで理解すれば正規分布表が使える。
例えば、あるテストの得点が正規分布に従い、
標準偏差 20点
平均 65点
受験者数 30人
だったとする。この時、80点以上(x≧80)の生徒が何%いるのかを考えてみよう。
先程の標準化により、x≧80の範囲が
65+20Z≧80
20Z≧15
Z≧0.7500
となる。Zをわざわざこのように表記したのは意味がある。
正規分布表の左端の列から0.7、右側の行から.05がクロスするところを読み取ると、0.2265という値が見つかる。
つまり、このテストの平均、標準偏差であれば、80点以上の生徒が約22.7%くらいいるということだ。
さらに、受験者数30人を掛けてあげれば、30×0.2265=6.795なので、その生徒の得点は7位くらいになる。
そして当然、平均である65点以上の生徒について調べてみると(50%だろ!)
65+20Z≧65
Z≧0.00
となる。正規分布表の左端の列から0.0、右側の行から.00がクロスするところを読み取ると、0.500という値が見つかる。
めでたく、平均65点以上の生徒は50%という結果になる。その順位は、30×0.500=15位くらいと予想通りの結果になる。
ちなみに、標準化することによって平均0、標準偏差1に自動的になっている。
まずは数学的な厳密さにはこだわらずに、ジャンジャン統計を楽しんでほしい。
実は母集団が小さいときは「t分布」というものを使ったらよいのだが、興味がある人は勉強してほしい。