重回帰分析4 | 統計解析道具箱~はじめての統計分析~

統計解析道具箱~はじめての統計分析~

Statistics never lie but liars use Statistics


重回帰分析がうまくいったかどうか(幼稚な表現ですが)の指標の1つが昨日のR2乗ですが、
もう一つ利用されるのが残差です。

残差とは、実測値と予測値の差のことで、予測が成功していれば、実測値と一致してくるはずです。
また、予測結果が実際の結果から乖離している場合は、予測がうまくいっていない(回帰式がよくない)と
判断されます。

したがって、残差はできるだけ小さいほうよいのですが、この残差が持つ2つの性質が分析結果を
考察する上で役立ちます。

1.残差は等分散になる(各観測値ごとに残差の大きさがほぼ同じになる)
2.残差は正規分布にしたがう

もし残差を利用して散布図を描いてみて、残差の散らばりに特徴があるようであればモデル構築を
見直すきっかけとすることができます。

また、残差が正規分布にしたがう性質を利用して、外れ値のチェックをすることもできます。
すなわち平均値と標準偏差を利用して、極端に大きい残差、または小さい残差を探して、モデルを
見直していくわけです。