統計学の入門書を読み返す(6) | 不動産鑑定、統計学、文系人間のための数学など

不動産鑑定、統計学、文系人間のための数学など

上野山清久のブログ
 「不動産鑑定と統計学」(同名のホームページも公開中です。)、数学その他に関する日々の学習成果等について「学ぶ側の視点」で綴っていこうかと思います。

○中心極限定理

 「母集団がどのような分布であっても、母集団から無作為抽出された n個の標本の標本平均は、nが大きくなるにつれて、平均μ、分散 の正規分布に近づく。」

 

 正規分布する母集団であれば、その「標本平均」も正規分布するというのが前回の話でしたが、今回は母集団が正規分布でなくても、標本数が十分大きければその「標本平均」は正規分布するという話です。

 

 前回と同様に、今回も「標本」が正規分布すると言っているのではなく、「標本平均」が正規分布すると言っているということに注意が必要です。

 また今回は標本数 nが小さい場合は適用できませんが、一般的には nが30個以上あればよいとされているようです。

 

 母集団が正規分布の場合は「標本」も正規分布しますが、母集団が正規分布でない場合は「標本」は正規分布しないという違いがありますが、よく読まないと今回も「標本」も正規分布するという定理だと勘違いしてしまいそうになります。

 

 でも、正規分布でない不規則な分布から n個の標本を抽出する場合(1個の標本を n回抽出する場合と考えてもよい)を考えると、その「標本」の分布は正規分布ではなくその不規則な分布を反映した分布になるはずです。

 

 てっきり「標本」が正規分布するものと思ったのにそうではないと分かってしまうと、それほどスゴい定理でもないようにも思ってしまいますが、それでも正規分布とは似ても似つかないような分布でも、標本数を多くするとその「標本平均」の分布は正規分布に近づいていくというのは何だか不思議な感じがします。

 

 要するに、「平均値」は正規分布したがっているということなんでしょう。