このテーマもうひといきです。。。


2変量(x、y)の散布図に各値をプロットした時に

相関があれば(強ければ)直線に近い形に並びます。


その相関関係をもっともよく表す線が回帰直線です。


回帰直線は実際には「最小二乗法」で求められるそうですが

この通信教育の範囲を超えるようで教科書では省略されています。

(「診療情報管理士のためのやさしい統計学」でも同様)


・・・難しくない方がいいので、省略大歓迎ですが(笑)


ここで回帰直線を求める時は

中学校でも習った方程式「y=a+bx」に当てはめ、(a=切片、b=傾き)

以下の手順で行います。


>>>


b(傾き) = r xy(相関係数) * ( sy(yの標準偏差) / sx(xの標準偏差) )

                   → xの標準偏差とyの標準偏差の比率


     Cob xy (=共分散)

rxy = ----------

     sx * sy


なので、これを代入すると


   Cov xy * sy

b = -----------

   sx * sy * sx


   Cov xy

 = -------

   sx * sx


   Cov xy

 = -------

     Vx (=xの分散)


となる。


[プログラム]
--------------------------------------------

// 傾きbを計算

double b = covxy / (sx * sx);

--------------------------------------------


>>>

       _   _

a(切片) = y - bx


(xの平均値,yの平均値)の点を考える。


yの平均値から

「xの増分分(xの平均値)に対するyの増分分」

を引いたものが切片となる。


この

「xの増分分(xの平均値)に対するyの増分分」

         _

「b(傾き) * x」


であるので、このようになる。


[プログラム]
--------------------------------------------

// 切片aを計算

double a = my - (b * mx);

--------------------------------------------