■ 「回帰分析」に関する知識を強化する!
普段の生活には全く縁がないと思われる数学知識ですが、市場分析という
世界に足を踏み入れたのであれば無関係とは言えない知識になるでしょう。
でも今更学生時代の教科書を引っ張り出すには・・ (ノ_・。)
と知識の取得を諦めてしまう方も多いことでしょう。当コンテンツは、そんな方々
へお贈りいたします。
■ 今回扱う知識以外に必要な知識
■ 今回扱う知識は「予測値と残差」
【傾きと切片を求めれば推定されたモデルは完成!】
最小二乗法により傾きと切片が求められればモデルは完成します。ただ、
モデルはあくまでも推定値であるため、推定されたモデルを評価していく
必要があります。その評価の手続きのために必要となるのが、
予測値と残差
です。求め方は簡単なのでプロセスを順に解説していきます♪
【予測値はモデルに独立変数を代入していく】
予測値は単に独立変数であるXに独立変数の値を代入していくだけです。
これは単回帰であっても重回帰であっても同じです。
上記モデルは重回帰のモデルですが、単回帰の場合は独立変数が1つだ
けなので「推定値y=a1X1+a0」だけになりますね (°∀°)b
これで予測値はデータ個数分導かれることになります!
ちなみに予測値は理論値と呼ばれることもありますが、要は推定されたモデ
ルによって導かれるY値となります。
推定されたモデルは独立変数の値から従属変数の値へ近似させる式です。
つまり、推定されたモデルとは従属変数の値の理論値とも言えるわけです。
上図のように、予測値が綺麗に直線として(赤線)導かれることはありませんが、
要は従属変数の散らばり具合に最も近くした値が予測値となります。
【残差はY軸となる従属変数から予測値を引く!】
残差の計算は求めた予測値を使って導きます。求め方は非常に単純で、
となります。つまり、「従属変数Y-予測値」ということですね!
残差も予測値と同じく、データの個数分導かれることになります。残差の計
算からもわかるとおり、
残差とは実測値と予測値の誤差
という考え方になっています。
あくまでも例ですが、残差のイメージは予測値(赤線)を理論値として、実測値
である従属変数Yの値との誤差は上図のようになります。適当にオレンジ線で
実測値との差を書いてみましたが、実測値と理論値との差が残差と覚えておけ
ば問題はないでしょう。
【残差の平方和を求めておく!】
今回は予測値と残差の意味と意味と導き方ですが、モデルの評価は何かと
平方和を多く求めることが多いのです。残差以外にも至る所で平方和を求め
るので先に平方和を求めておきましょう♪
平方和とは文字通り、
対象を2乗して、それらの総和を求める
ことを意味します。残差の平方和を数式として表しますと、
となります。つまり偏差平方和と同じことを意味するわけです。偏差平方和は
データの散らばり具合を示す統計量
であるため、予測値と実測値との適合具合が計算によって導かれそうだなとい
うことは予想できると思います。
回帰モデルの評価は意外と難しい理屈で成り立っているものが多くあります。
項目に分けて解説していきますが、順に計算を行えば理解不能になることは
ないはずです。気長にいきましょう (^O^)/
次回はExcelによる例題を扱います♪