(その1)で標準化量Z、(その2)で標準偏差σを扱ったので、

Z=(x-x0)/σ


の見方が変わったのではないだろうか。

分子で平均とのズレを、分母でズレの基準をつくったわけだ。


Zをxについて解くと、x=x0+σZとなる。中1の数学の等式変形だ。ここまで理解すれば正規分布表が使える。



例えば、あるテストの得点が正規分布に従い、

標準偏差 20点

平均 65点

受験者数 30人


だったとする。この時、80点以上(x≧80)の生徒が何%いるのかを考えてみよう。

先程の標準化により、x≧80の範囲が

65+20Z≧80

20Z≧15

Z≧0.7500


となる。Zをわざわざこのように表記したのは意味がある。

正規分布表の左端の列から0.7、右側の行から.05がクロスするところを読み取ると、0.2265という値が見つかる。

つまり、このテストの平均、標準偏差であれば、80点以上の生徒が約22.7%くらいいるということだ。

さらに、受験者数30人を掛けてあげれば、30×0.2265=6.795なので、その生徒の得点は7位くらいになる。


そして当然、平均である65点以上の生徒について調べてみると(50%だろ!)


65+20Z≧65

Z≧0.00


となる。正規分布表の左端の列から0.0、右側の行から.00がクロスするところを読み取ると、0.500という値が見つかる。

めでたく、平均65点以上の生徒は50%という結果になる。その順位は、30×0.500=15位くらいと予想通りの結果になる。




ちなみに、標準化することによって平均0、標準偏差1に自動的になっている。

まずは数学的な厳密さにはこだわらずに、ジャンジャン統計を楽しんでほしい。


実は母集団が小さいときは「t分布」というものを使ったらよいのだが、興味がある人は勉強してほしい。