2変量の統計（回帰直線）

このテーマもうひといきです。。。

2変量（x、y）の散布図に各値をプロットした時に

相関があれば（強ければ）直線に近い形に並びます。

その相関関係をもっともよく表す線が回帰直線です。

回帰直線は実際には「最小二乗法」で求められるそうですが

この通信教育の範囲を超えるようで教科書では省略されています。

（「診療情報管理士のためのやさしい統計学」でも同様）

・・・難しくない方がいいので、省略大歓迎ですが（笑）

ここで回帰直線を求める時は

中学校でも習った方程式「y＝a＋bx」に当てはめ、（a=切片、b=傾き）

以下の手順で行います。

＞＞＞

b（傾き） = r xy（相関係数） * (　sy（yの標準偏差）　/　sx（xの標準偏差）　)

　　　　　　　　　　　　　　　　　　　→　xの標準偏差とyの標準偏差の比率

　　　　　Cob xy　（＝共分散）

rxy = ----------

　　　　　sx * sy

なので、これを代入すると

　　　Cov xy * sy

b =　-----------

　　　sx * sy * sx

　　　Cov xy

　=　-------

　　　sx * sx

　　　Cov xy

　=　-------

　　　　　Vx　（＝xの分散）

となる。

［プログラム］
--------------------------------------------

// 傾きbを計算

double b = covxy / (sx * sx);

--------------------------------------------

＞＞＞

　　　　　　　_　　　_

a（切片） = y - bx

（xの平均値，yの平均値）の点を考える。

yの平均値から

「xの増分分（xの平均値）に対するyの増分分」

を引いたものが切片となる。

この

「xの増分分（xの平均値）に対するyの増分分」

が

「b（傾き）　*　x」

であるので、このようになる。

［プログラム］
--------------------------------------------

// 切片aを計算

double a = my - (b * mx);

--------------------------------------------