2変量の相関分析 | SPSS備忘録

2変量の相関分析

今月は「(クロス集計表を利用する2変数の)カイ二乗検定 」や「独立したサンプルのt検定 」の記事で、このふたつは関係があるとかないとかを書いていきました。本日はそのつながりで「2変量の相関分析」を取り扱います。


この分析はふたつの数値変数から散布図をプロットさせたとき、線型関係が統計的に認められるかと、認められる場合にどれくらいの強さが認められるかを計算するものです。


例えば、変数「東京駅までの距離」と「交通費」を利用して「距離の値が大きい(東京駅から遠くなる)ほど交通費の値が大きい(交通費がかかる)」という正の相関を統計的に証明したり、変数「東京駅までの距離」と「地価」を利用して「距離の値が大きい(東京駅から遠くなる)ほど地価の値が小さい(地価が安い)」という負の相関を統計的に証明したり出来ます。


SPSSに元々入っている「C:\Program Files\SPSS\Cars.sav」を読み込みます。


今回のデータは正確性の検定 をしたところ正規分布をしていないようですが、この分析は正規分布をしている前提の分析です。しかし締め切りまでの時間の都合上、申し訳ございませんが「正規分布をしていると仮定して」説明いたします。


SPSSのメニューの、[分析]→[相関]→[2変量]をクリックします。


ダイアログ(2変量の相関分析).

左の変数リストより「1ガロン当りのマイル数[燃費]」と「エンジン排気量(立方インチ)[エンジン]」を右の[変数]に移動します。[変数]は3つ以上の変数を投入できますが、この場合は「AとB」「BとC」「AとC」のたすきがけになり、あくまで2変数間での分析になります。


このブログは最低限の説明なので、そのまま[OK]をクリックして実行してください。実行すると、


出力(2変量の相関分析)


という結果が出力されます。ちなみに「変数1と変数2」とは「変数2と変数1」と同じなので、結果はたすきがけのように反対側を見ても同じ結果になります。


あらかじめ「2変数間に差はない」という仮説がたっており、[有意確率(両側)]が「.050」未満の場合は仮説が棄却され「2変数間に差はある」となります。今回の分析では、「マイル数とエンジン排気量には差はない」という仮説が棄却され、「マイル数とエンジン排気量には差がある」という結論になり、相関係数が有用であることを示します。


その上で[Peasonの相関係数]をみると「-.789」となっております。相関係数は-1から1の間の値となり、正の場合は正の相関、負の場合は負の相関となって、絶対値が大きいほど強い関係といえます。今回の結果は「-0.789」なので、強い負の相関があると言え、「エンジン排気量が大きいほど1ガロンでちょっとしか進まない」あるいは「1ガロンで遠くまで行くにはエンジン排気量が低い必要がある」ということになります。