このテーマもうひといきです。。。
2変量(x、y)の散布図に各値をプロットした時に
相関があれば(強ければ)直線に近い形に並びます。
その相関関係をもっともよく表す線が回帰直線です。
回帰直線は実際には「最小二乗法」で求められるそうですが
この通信教育の範囲を超えるようで教科書では省略されています。
(「診療情報管理士のためのやさしい統計学」でも同様)
・・・難しくない方がいいので、省略大歓迎ですが(笑)
ここで回帰直線を求める時は
中学校でも習った方程式「y=a+bx」に当てはめ、(a=切片、b=傾き)
以下の手順で行います。
>>>
b(傾き) = r xy(相関係数) * ( sy(yの標準偏差) / sx(xの標準偏差) )
→ xの標準偏差とyの標準偏差の比率
Cob xy (=共分散)
rxy = ----------
sx * sy
なので、これを代入すると
Cov xy * sy
b = -----------
sx * sy * sx
Cov xy
= -------
sx * sx
Cov xy
= -------
Vx (=xの分散)
となる。
[プログラム]
--------------------------------------------
// 傾きbを計算
double b = covxy / (sx * sx);
--------------------------------------------
>>>
_ _
a(切片) = y - bx
(xの平均値,yの平均値)の点を考える。
yの平均値から
「xの増分分(xの平均値)に対するyの増分分」
を引いたものが切片となる。
この
「xの増分分(xの平均値)に対するyの増分分」
が
_
「b(傾き) * x」
であるので、このようになる。
[プログラム]
--------------------------------------------
// 切片aを計算
double a = my - (b * mx);
--------------------------------------------