重回帰分析を行う場合に、重要な視点になるのが、「どの変数を使って分析をするか」です。
重回帰分析は予測分析の手法で、原因となる変数から結果となる変数の予測式をたてるわけですが、
原因を独立変数、結果を従属変数と呼んで使います。
このとき、独立変数と従属変数の間には強い相関があることが望まれます。
原因と結果の間に、何の関係性もないとしたら、予測式なんて作れっこないわけです。
そして、意外と見落としがちなのが、独立変数間の関係です。
予測分析を行う場合、独立変数間は無相関であることが望まれます。
ただし、まったくの無相関である独立変数を観測することは困難なので
多くの場合、独立変数間の相関が強すぎないことが要求されます。
このとき、独立変数間の相関が強すぎる場合に発生する現象が、回帰分析のテキストには
必ずといっていいほど説明されている多重共線です。
(この記載がないテキストは使わないほうがよいでしょう)
重回帰分析を行う場合は、多重共線にならないように心がけることが鉄則です。
多重共線を疑うような相関の数値の目安は、0.9以上にするとよいと思います。
無難に考えるのであれば、0.8以上で考えてみてください。
そのような高すぎる相関を示す独立変数の場合、どちらのみを分析に残して使うようにするのが
基本です。