重回帰分析2 | 統計解析道具箱~はじめての統計分析~

統計解析道具箱~はじめての統計分析~

Statistics never lie but liars use Statistics


重回帰分析を行う場合に、重要な視点になるのが、「どの変数を使って分析をするか」です。

重回帰分析は予測分析の手法で、原因となる変数から結果となる変数の予測式をたてるわけですが、
原因を独立変数、結果を従属変数と呼んで使います。

このとき、独立変数と従属変数の間には強い相関があることが望まれます
原因と結果の間に、何の関係性もないとしたら、予測式なんて作れっこないわけです。

そして、意外と見落としがちなのが、独立変数間の関係です。

予測分析を行う場合、独立変数間は無相関であることが望まれます。
ただし、まったくの無相関である独立変数を観測することは困難なので
多くの場合、独立変数間の相関が強すぎないことが要求されます。

このとき、独立変数間の相関が強すぎる場合に発生する現象が、回帰分析のテキストには
必ずといっていいほど説明されている多重共線です。
(この記載がないテキストは使わないほうがよいでしょう)

重回帰分析を行う場合は、多重共線にならないように心がけることが鉄則です。
多重共線を疑うような相関の数値の目安は、0.9以上にするとよいと思います。
無難に考えるのであれば、0.8以上で考えてみてください。

そのような高すぎる相関を示す独立変数の場合、どちらのみを分析に残して使うようにするのが
基本です。