分割表(クロス集計表)は、2つの「質的変数」の関係を分析する手法です。
質的変数としては、「性別(男性、女性)」「購入状況(買う、買わない)」「年代(10代、20代、30代)」
「地域(東南地区、港湾地区、山の手)」「満足度(良い、ふつう、悪い)」などが挙げられます。
興味のある変数を縦(列)と横(行)に配置してその度数(人数)を評価・比較します。
この際、度数だけではなく列合計や行合計を基準にしたパーセント(%)を計算して表示するのが基本です。
また、行変数と列変数(図の例では、教室と性別)の間に何か関係性が認められる場合には、その傾向が
母集団全体に対してもあてはまることを、「仮説検定」によって調べますが、この場合に適切な手法が
「カイ2乗検定」になります。
SPSSなどの統計ツールを利用すれば簡単に検定結果を出力することができますが、
Excel等のツールでも計算可能です。もちろん、カイ2乗分布表を利用して手計算で求めることもできます。
この場合、検定結果として得られた有意確率は、一般的に利用される5%水準(0.05)を下回る数値が
得られているため、仮説を棄却し、2つの変数には有意な関係が認められると判断されます。
重回帰分析を行う際には、候補となる独立変数(原因)と従属変数(結果)において相関係数を計算し、変数間の関係性を見ておく必要がありますが、このとき独立変数同士で高すぎる・強すぎる相関を示す関係がないかどうかを吟味しておくことが重要です。
これは多重共線にならないかどうかを調べるための作業です。
ご存知の方も多いと思いますが、多重共線性があると回帰式の係数の推定ができなくなったり、または異常な数値が出力されることになってしまいます。
多重共線性になると思われる高い相関を示す独立変数は、その一方を回帰式に含めないようにすることで対応します。実務での目安は絶対値で「0.8~」くらいでしょうか。
いずれにしても、できあがった回帰式を吟味することが大切です。
これは多重共線にならないかどうかを調べるための作業です。
ご存知の方も多いと思いますが、多重共線性があると回帰式の係数の推定ができなくなったり、または異常な数値が出力されることになってしまいます。
多重共線性になると思われる高い相関を示す独立変数は、その一方を回帰式に含めないようにすることで対応します。実務での目安は絶対値で「0.8~」くらいでしょうか。
いずれにしても、できあがった回帰式を吟味することが大切です。
