クロス集計表のカイ2乗検定と連関係数 | 統計解析道具箱~はじめての統計分析~

統計解析道具箱~はじめての統計分析~

Statistics never lie but liars use Statistics

クロス集計表はカテゴリ変数同士の組み合わせで関係性を分析する
統計解析手法です。
その関係性が母集団にもあてはまることかどうかを調べるためには、統計的仮説検定が必要であり、
独立性の検定ともよばれるカイ2乗検定を利用します。

カイ2乗検定が有意となれば、変数の独立性が否定されて、母集団でも関係性が認められることが示唆されます。(独立とは統計学の用語で、関係がないことを意味する表現です)

しかし、カイ2乗検定も統計的仮説検定であるため、サンプルサイズが結果に大きな影響を与えます。

つまり、サンプルサイズが大きい場合はわずかな差でも有意になりやすく、サンプルサイズが小さい場合は大きめの差でも有意になりにくいのです。

そうすると、有意な結果となったときに、果たして本当に関係性があるといっていいのか、単純にサンプルサイズが大きいがゆえに有意となっているだけなのかの識別が難しくなります。

そこで、関係性の強さをあらわす指標を利用します。
これが連関係数で、スケール変数の関係性をあらわす相関係数に近似します。

2×2(2行2列)のクロス集計表の場合は、ファイ係数を利用し、2×2以上の場合は、クラメールのVとよばれる指標を使います。いずれも、0~1の範囲をとりますので、1に近いほど関係性が強いと判断できます。
これは医療データに基づく場合は、効果量(効果の大きさ)として表現されることもあります。