量的データ同士の直線の関係の強さを測るのが相関係数ですが、この相関係数には少しだけ統計上のお作法があります。
一般的に何の断りもなく「相関係数」と言った場合、Pearson(ピアソン)の相関係数を指しますが、この統計量を使用するには、量的データが正規分布にしたがう必要があるという条件がつきます。
正規分布(上記の図のイメージ)とは、統計をやっていく上でまず最初に学習する基本的な分布のことですが、自然発生する現象の多くがこの正規分布と呼ばれ る分布にしたがう性質を持っています。ちょうど富士山のような中央が盛り上がって左右対称の曲線を描きます。何かを測定したときの誤差もこの正規分布にし たがいます。
したがって、Pearsonの相関係数を使用するためには、厳密には事前に使用するデータが正規分布にしたがうかどうかを調べて、正規分布にしたがうと判断されれば、相関係数を計算していく流れになります。
もし、正規分布にしたがわない場合は、Pearsonの相関係数は正しい作法にしたがっていませんので、別の統計量を使用する必要があるのですが、それがSpearman(スピアマン)の相関係数です。
これは元の量的データを順位データに変換してから相関係数を計算する方法で、Excelでも利用できます。
ただし、Pearsonの相関係数もSpearmanの相関係数も結果に大きな差を生じないことが多いことから、実際の分析の場面では(特にデータが多い場合)、正規分布かどうかを問題にすることなく、Pearsonの相関係数を利用することが多いです。