統計解析道具箱~はじめての統計分析~ -7ページ目

統計解析道具箱~はじめての統計分析~

Statistics never lie but liars use Statistics


等分散性の評価(3)サンプルサイズ

t検定を行う際に確認すべき等分散性の仮定については、サンプルサイズが同じ場合には無視してもかまわないとする考え方もあります。

すなわち、例えば男女間でなんらかの検査値に有意な差があるかどうかを調べたい場合に、男女のそれぞれの人数が同じ場合には、等分散性の評価をすることなく、t検定にかけてしまうという扱いです。
(もちろん、この場合でも正規性の評価 は別問題ですので、吟味する必要があります)

調査研究、実験研究の最初の段階で、集めるべきサンプル数を考えておく必要があるわけです。

ただし、綺麗にデータをそろえることも難しい場合がありますので、多少のサンプルサイズの違いは目をつむり、その代わり、等分散性の評価をします。

一般に、t検定を使う場合のサンプルサイズの違いは、1:3程度までとすることが多いようです。


等分散性の評価(1)等分散
等分散性の評価(2)等分散性の検定
等分散性の評価(3)サンプルサイズ

等分散性の評価(2)等分散性の検定

2群において、量的変数の分散が等しいことが仮定されるのが、t検定ですが、分散が等しいといえるかどうかは、標本のデータの話ではなく、母集団において等分散といえるかどうかが視点になります。

したがって、仮説検定を実行して、等分散性を評価するのが一般的です。

等分散を調べるための仮説検定には、さまざまなものがありますが、正規性からの逸脱に頑健である手法がLevene(リーベン、レーベン、ルビーン:いろいろな呼び方がされています)検定です。

検定される帰無仮説は「2群の分散は等しい」ですので、この仮説が棄却されなければ、等分散を仮定することになります。正規性の検定と同様、サンプルサイズが極端に大きい場合や、極端に小さい場合は、使用に注意が必要です。


等分散性の評価(1)等分散
等分散性の評価(2)等分散性の検定
等分散性の評価(3)サンプルサイズ
等分散性の評価(1)等分散

t検定は、2群(グループ)間の平均値に統計的に有意な差が認められるかどうかを調べる検定手法ですが、この場合、2群の量的変数の分散(散らばり)が同じであることが前提となります。

この前提を満たす場合を「等分散性」と呼び、t検定を利用する場合には、必ず評価すべきポイントになります。これは、先に記載した正規性の仮定よりも重要です。

等分散性の仮定を満たすことができる場合は、t検定を利用しますが、等分散といえない場合は、代替としてそのほかの手法を利用することになります。

この等分散性の仮定は、t検定だけではなく、分散分析においても求められるものです。


等分散性の評価(1)等分散
等分散性の評価(2)等分散性の検定
等分散性の評価(3)サンプルサイズ