正規性の評価(4)サンプルサイズ
量的変数の正規性を評価するためには、ヒストグラムや正規性の検定を用いますが、そのほかにサンプルサイズに注目することも大切です。
特に正規性の検定によって、正規分布かどうかを判定する場合、サンプル数が極端に多い場合や極端に少ない場合には、検定結果の有用性は低下しますので、注意が必要です。
そこで1つの目安として利用されることが多いのが、n=30です。
すなわち、サンプル数が30に満たない場合は、たとえ正規性の検定結果から正規性が仮定できそうでも、正規分布とは判定せず、逆にサンプル数が30を超える場合、正規性からの逸脱が認められても、正規分布と判定してしまう(ちょっと乱暴ですが)基準です。
統計をやっていると、サンプル数が30という目安をよく聞きます。
この根拠となるのは、中心極限定理と呼ばれるものです。
特に、「サンプル数が30に満たない場合は、正規分布とは考えずに、変数変換やノンパラメトリック検定を利用する」と考えてみるのもよいでしょう。
正規性の評価(1)ヒストグラム
正規性の評価(2)正規性の検定
正規性の評価(3)歪度と尖度
正規性の評価(4)サンプルサイズ
正規性の評価(5)頑健性