具体的には、線型(直線)の関係を評価する指標で、小文字「r」で表現されます。
正確には、これをPearsonの積率相関係数と呼びます。
正確には、これをPearsonの積率相関係数と呼びます。
この相関係数は、本来は正規分布に従うデータに適用するのがお作法どおりのやり方なのですが、
一般的に「正規分布するかどうか」はそれほど重要なポイントではないので、ここでは省略します。
一般的に「正規分布するかどうか」はそれほど重要なポイントではないので、ここでは省略します。
Excelを利用するのであれば、図のように2つの量的データ(図では「電気代」「ガス代」)を列に入力しておいて、
統計関数「CORREL()」を利用します。
統計関数「CORREL()」を利用します。
相関係数(r)は、-1から+1の範囲を取り、絶対値で「1」に近いほど強い関係を示します。
一般的に使われる指標は下記の目安です。
一般的に使われる指標は下記の目安です。
0.0~0.2 ほとんど線型の相関なし
0.2~0.4 やや線型の相関あり
0.4~0.7 かなり線型の相関あり
0.7~1.0 強い線型の相関あり
0.2~0.4 やや線型の相関あり
0.4~0.7 かなり線型の相関あり
0.7~1.0 強い線型の相関あり
上記の図では、「0.643」という数値が得られていますので「かなり、もしくは強めの相関が認められる」と解釈できることになります。符号は+ですので、「正の相関(一方が上昇するともう一方も上昇する)」であることが分かります。
なお、この相関係数(r)は、外れ値の影響を強く受けますので、事前に散布図でグラフ化するなどして、関係性の全体像や外れ値の有無をチェックしておくことが肝要です。
