統計解析道具箱~はじめての統計分析~ -3ページ目

統計解析道具箱~はじめての統計分析~

Statistics never lie but liars use Statistics

t検定Welch検定はともに「母平均の差の検定」(母集団におけるグループ間の平均値に差が認められるか)です。

論文やレポートにおいても、この2つの検定はよく見かける手法ですが、この2つの手法の違いはなんでしょうか?

それは「等分散を仮定するかどうか」です。

t検定は2群(2グループ)間の平均値の差の検定ですが、このとき2群の散らばりは等しい(等分散)ことが前提となります。したがって、t検定を使用する前に散らばりが等しいかどうかを、グラフや検定を用いて調べます。言い換えるならば、t検定は「等分散の場合の母平均の差の検定」です。

(等分散の検定には、リーベン(Levene)検定、F検定、バートレット(Bartllet)検定などがあります)

Welch検定は2群(2グループ)間の平均値の差の検定に利用できますが、このとき等分散かどうかを問題としません。言い換えるならば、Welch検定は「等分散でない場合の母平均の差の検定」です。

ちなみにかなり乱暴ですが、等分散かどうか判断に困る場合は、Welch検定を利用してしまう方法もあります。
実際、フリーの統計ソフトRでは、Welch検定がデフォルトに設定されています。
あるスケール変数を説明変数(独立変数)として、
別のスケール変数を被説明変数(従属変数)
予測するための、予測式を求める分析手法が回帰分析です。
回帰分析によって求められる予測式のことを、回帰式といいます。

回帰式に説明変数が1つだけ含まれる場合は、単回帰分析と表現され、
回帰式に説明変数が2つ以上含まれる場合は、重回帰分析と表現されます。

単回帰分析は2変量解析と言い換えることができます(説明変数1、被説明変数1)が、
重回帰分析は多変量解析に分類されます(説明変数n、被説明変数1)。

因果関係に興味があって分析する場合、一般にはただ1つの原因によって結果を説明できることは
まれなので、複数の要因をもとに結果を説明する重回帰分析が行われます。
スケール変数が正規分布にしたがうものかどうかを調べる方法に正規性の検定があります。
正規性の検定のなかでよく使われる代表的な検定が、シャピロ・ウィルク(shapiro-wilk)検定です。

母集団に対する仮説を立てて、その仮説のもとで標本から得られる検定統計量の発生確率を調べるのは、
すべての統計仮説検定に共通することですが、この際に重要なのは仮説の形です。

では、シャピロ・ウィルクにおける検定すべき帰無仮説はどのような形になるでしょうか?

帰無仮説(H0):変数の分布は正規分布である
対立仮説(H1):変数の分布は正規分布ではない

したがって、有意確率(P)<0.05となり、帰無仮説が棄却(reject)される場合には、
「変数は正規分布にしたがうとはいえない」と判定されることになります。

つまり、有意確率(P)≧0.05となり、帰無仮説が棄却できない場合には、
「変数は正規分布にしたがう」と判定されることになりますが、仮説検定の大原則
「帰無仮説が棄却されない場合は、なにも結論がでない」(=帰無仮説を積極的に採択してはいけない)に反します。

そこで、正確には「変数は正規分布にしたがわないとはいえない」とコメントするのが適切なのですが、
まどろっこしいので、「変数は正規分布にしたがう」と解釈してしまうのです。

帰無仮説が保留になった場合(棄却されない場合)に、正規分布を仮定することができる検定です。