統計解析道具箱~はじめての統計分析~ -6ページ目

統計解析道具箱~はじめての統計分析~

Statistics never lie but liars use Statistics


比較の対象(2)対応のないデータ

男女における検査値の違い(例)
性別(男・女)でグループに分けて、それぞれの検査値(量的データ)に有意な差があるかどうかを調べます。
検査値が正規分布にしたがうことが仮定できればt検定を利用します。
また、男女で検査値の散らばり(分散)が同程度であることも必要となりますが、サンプル数が同じであれば等分散の仮定は無視してもよいでしょう。
この場合、比較する対象は、男と女です。同じ人が両方のグループに所属することはなく、対応のない別人同士を比較することになります。

治療群と統制群における血圧値の違い(例)
グループ(治療群・統制群)に分けて、それぞれの血圧値(量的データ)に有意な差があるかどうかを調べます。
血圧値が正規分布にしたがうことが仮定できればt検定を利用します。
また、治療群と統制群で血圧値の散らばり(分散)が同程度であることも必要となりますが、サンプル数が同じであれば等分散の仮定は無視してもよいでしょう。
この場合、比較する対象は、治療群と統制群です。同じ人が両方のグループに所属することはなく、対応のない別人同士を比較することになります。

AクラスとBクラスにおける理解度の違い(例)
クラス(A・B)に分けて、それぞれの理解度(量的データ)に有意な差があるかどうかを調べます。
理解度が正規分布にしたがうことが仮定できればt検定を利用します。
また、AクラスとBクラスで理解度の散らばり(分散)が同程度であることも必要となりますが、サンプル数が同じであれば等分散の仮定は無視してもよいでしょう。
この場合、比較する対象は、AクラスとBクラスです。同じ人が両方のグループに所属することはなく、対応のない別人同士を比較することになります。

このように、ペアにして比較するべきではないものを対応のないデータとして処理します。

比較の対象(1)対応のないデータ

2群(グループ)の平均値の差を調べる場合に、何と何を比較するのかが重要なポイントになります。
通常、この問題は検定を実行する前、さらにデータを収集する前に決定しておくべき事項です。

その比較の対象として、「対応のないデータ」と「対応のあるデータ」の2つを考えます。

対応のないデータ
文字通り比較する2群に対応がない場合を指します。例えば、男と女を比較したい、治療群と統制群を比較したい、AクラスとBクラスを比較したい、などです。あるサンプル(対象者)が同時に両方のグループに所属することはありません。どちらかのグループにだけ所属し、異なるケースを比較する場合です。

対応のあるデータ
医療データの解析でよく利用され、2群に対応がある場合を指します。例えば、治療前と治療後のデータを比較したい、前期と後期の結果を比較したい、右手と左手の握力を比較したい、夫婦間の意識の違いを比較したい、などのようにサンプルをペアにして調べる場合です。

どちらを利用するかで、分析の際のアプローチや計算方法なども変わりますので、事前に確認をしておく必要があります。t検定と一言でくくられますが、これはt値を利用する検定を総称した呼び方で、中身は多様です。




等分散性の評価(4)手法の使い分け

まず、標本において2群の散らばりを吟味し、そのうえで、Levene検定などの等分散性を評価する仮説検定によって、t検定の前提となる、等分散性を満たすことができるかどうかを調べます。

首尾よく等分散を仮定できるのであれば、t検定によって、2群の平均値に差があるかどうかを調べますが、t検定の前提である等分散を仮定できない場合は、どうすればよいでしょうか。

この場合に利用される統計手法が、Welch(ウェルチ)検定です。
この手法は、等分散を仮定できない場合の母平均の差の検定であり、t検定に限らず等分散を仮定できない場合の分散分析でも利用される手法です。自由度を小数で求めて調整し、t値を算出します。

レポートや論文に記載する場合にも、等分散性を仮定できない場合には、Welch検定によって有意差を検出した(または有意差にならなかった)旨を記載することになります。