統計解析道具箱~はじめての統計分析~ -9ページ目

統計解析道具箱~はじめての統計分析~

Statistics never lie but liars use Statistics

正規性の評価(2)正規性の検定

量的変数が正規分布にしたがうかどうかを調べる第2の方法は仮説検定によるものです。
正規性を評価する仮説検定を実行して、変数の分布が正規分布にしたがうといえるかどうかを調べます。

ヒストグラムと同様、SPSSを利用する場合は、Kolmogorov-Smirnov(コルモゴロフ・スミルノフ)検定
または、Shapiro-Wilk(シャピロ・ウィルク)検定が利用できます。

検定すべき帰無仮説は、「変数の分布は正規分布にしたがう」です。
有意確率(P値)が、0.05未満となり、帰無仮説が棄却される場合は、正規分布にしたがわない、と
判定されます。


統計解析道具箱-正規性の検定2





仮説検定は、数値に基づいて客観的に判断できるため、便利なようにも思えますが、手法としては
仮説検定に過ぎないため、誤用を避けるように注意をしなければなりません。

したがって、ヒストグラムを一緒に見て、誤った判断をしないようにします。

正規分布を仮定できる場合は、t検定で平均値の差を調べていきますが、正規分布を仮定できない場合は、
変数に変換をかけたり、ノンパラメトリック検定を利用するなど、別の手段を考えなければなりません。

一般的によく利用されるのは、ノンパラメトリック検定になります。
正規分布を仮定できるかどうか判断に迷う場合は、ノンパラメトリック検定を利用すれば無難でしょう。


正規性の評価(1)ヒストグラム
正規性の評価(2)正規性の検定
正規性の評価(3)歪度と尖度
正規性の評価(4)サンプルサイズ
正規性の評価(5)頑健性


正規性の評価(1)ヒストグラム

量的変数が正規分布にしたがうかどうかを調べる第1の方法はグラフによるものです。
ヒストグラムを作成して、正規曲線に適合するかどうかを視覚的に調べます。

代表的な統計ソフトのSPSSを利用する場合は、以下の手順で作成できます。

1.[グラフ]-[レガシーダイアログ]-[ヒストグラム]メニューを選択します。
2.変数ボックスに、量的変数を移動します。
3.「正規曲線の表示」チェックボックスをオンにします。
4.OKボタンをクリックします。

ヒストグラムが出力されますので、正規分布を仮定できそうかどうかを吟味します。
正規曲線に概ね一致すればよしとします。
この際、正規分布とするか、正規分布といえないと判断するかは、判断が主観的であり
人によって異なります。そこで、数値によって判断する方法を併用するとよいでしょう。



正規性の評価(1)ヒストグラム
正規性の評価(2)正規性の検定
正規性の評価(3)歪度と尖度
正規性の評価(4)サンプルサイズ
正規性の評価(5)頑健性

t検定は、t値を利用する検定全般を指しますが、一般的には「2群間の平均値の差の検定」として利用されています。統計解析では、異なる条件の2つのグループ(2群)に分けて比較する調査をよく行いますので、非常に利用頻度の高い統計手法です。

例えば、「男性と女性における収入の差」、「治療群(治療を施したグループ)と統制群(治療を施さないグループ)における検査値の差」、「AクラスとBクラスの成績(得点)の差」などを調べるときに利用します。

手計算で行う場合は、それぞれの平均値や標準偏差(分散)、サンプル数の情報に基づいて「t値」を計算し、サンプル数から自由度を求めた上でt分布から、標本で得られるt値の確率を求めます。いわゆる、有意確率を計算し、2群の平均値が等しいとの仮説が棄却できるかを調べます。

統計ソフトを利用すればこれらの計算は非常に簡単に行うことができますが、t検定を利用するには、(1)分布の確認(正規分布にしたがうかどうか)、(2)分散の確認(散らばりが等しいといえるか)、(3)サンプルサイズ、などのポイントを抑えなければなりません。