相関係数は、n個のデータ
に対して

で定められる。ただし、

とした。
相関係数の定義式は一見複雑な形をしているが、ベクトルを使うと簡潔に書ける。実際、


とすれば、相関係数は、

と書ける。これはベクトルを使って書き変えただけだが、

を使えば、
さらに、

となる。θは2つのベクトル
がなす角である。
n次元ベクトルでも成り立つことは認めるとする。
イメージを養うため、n=3の場合を考える。
3個のデータ
に対して、相関係数が、

で定められる。
ベクトル
は、第1成分にx_1の平均からのずれ、第2成分にx_2の平均からのずれ、第3成分にx_3の平均からのずれを置いてできる3次元ベクトルである。(下図)

の方も同様である。
よってθは、
の
からのずれと、
の
からのずれとの差異を表している。
θ=0°なら、平均からのずれ方が、xとyで全く同じということである。つまり、

よって、

すべてのkに対して、

バーの付いてるところは定数であることに注意すれば、すべてのデータが直線
上にあることがわかる。ゆえに、xとyには相関がある。このとき相関係数は、cos0°=1である。
θ=180°なら、平均からのずれ方が、xとyで真逆ということである。つまり、

さっきと同じように考えると、すべてのデータが直線
上にあることがわかる。ゆえに、xとyは相関がある。このとき相関係数は、cos180°=-1である。
また、θ=90°なら、相関は望めそうにない。相関係数は、cos90°=0
<まとめ>
相関係数というのは、データの平均からの“ずれベクトル”
のなす角θの余弦である。
で定められる。ただし、
とした。
相関係数の定義式は一見複雑な形をしているが、ベクトルを使うと簡潔に書ける。実際、
とすれば、相関係数は、
と書ける。これはベクトルを使って書き変えただけだが、
を使えば、
さらに、となる。θは2つのベクトル
n次元ベクトルでも成り立つことは認めるとする。
イメージを養うため、n=3の場合を考える。
3個のデータ
で定められる。
ベクトル

よってθは、
θ=0°なら、平均からのずれ方が、xとyで全く同じということである。つまり、
よって、
すべてのkに対して、
バーの付いてるところは定数であることに注意すれば、すべてのデータが直線
θ=180°なら、平均からのずれ方が、xとyで真逆ということである。つまり、
さっきと同じように考えると、すべてのデータが直線
また、θ=90°なら、相関は望めそうにない。相関係数は、cos90°=0
<まとめ>
相関係数というのは、データの平均からの“ずれベクトル”

