前回「世界の経営学者はいま何を考えているのか」を紹介しましたが、今経営学者の間では「内生性」(endogeneity)を考えることが必須になっているそうです。

「内生性」とは何か?

本書では、内生性を「回帰分析の説明変数と誤差項に相関があり、回帰分析の有効性に重要な一致性の条件を満たさない」ことと説明しています。wikipediaでも、「計量経済モデルにおいて、説明変数と誤差項との間に相関があるときに、内生性がある」と定義しています。

でも、これだと、あまりに堅苦しい定義で、イメージが湧きません。具体的にどんなモデルで分析すると「内生性」が発生し、「一致性」が確保されなくなる(=いくらデータを沢山もってきても真の値に近づかない)のかよく分かりません。しかも、内生性という言葉が持つニュアンスと定義が繋がりません。

ということで、どんなときに内生性が発生するのか、簡単に調べてみました。


①まず、同時性(simultaneity)の存在です。

以前の私の記事でも、

経済変数間に、複数の方程式であらわされるような複雑な相互依存関係(ある変数の変化が他の変数を変化させ、その変化がまた自分に帰ってくるようなグルグルした関係)が存在する場合(=同時方程式モデルという)

だと、説明変数と誤差項に相関が発生(=「内生性」の定義)すると書きました。

これは、「内生性」の言葉のもつイメージに近いですね。説明変数の値が、そのモデルの中の被説明変数の影響も受ける。まさに説明変数、被説明変数どうしでお互いに依存関係が生じ、それぞれの値がモデルの内側で決まってくる、とでも言えるでしょうか。


②次に、本書でも紹介されている欠落変数がある場合です。

独自資本と買収のどちらが海外子会社の利益率にとってプラスか?という命題に対して、過去多くの統計的な検証が行われたものの「企業の技術力」という極めて重要な変数を入れなかったために、統計的に間違った結論を得てしまった例をあげています。企業の技術力は、独自資本か買収かの選択にも影響を与え、なおかつ、利益率そのものにも当然プラスの効果を与えます。つまり、命題の「原因・説明変数」(独自資本か買収か)と「結果・被説明変数」(利益率)の両方に影響を与えます。外生変数だと思っていた「独自資本か買収か?」という説明変数が、「企業の技術力」という新たな変数(交絡要因という)の登場により、実は内生変数であることが分かった、とも言えます。もともと誤差項は、モデルに投入していない未観察の様々な要因による非説明変数への影響の寄せ集め。「企業の技術力」を示す変数を明示的にモデルに組み込み、誤差項からその影響を除いてあげないと、説明変数と誤差項が相関したままになってしまい、正しい結論が出ないということになります。

これは、研究や分析を行う人にとっては、なかなか厳しい要請です。というのも、関心のある変数、またはデータが取れる変数だけを取り出して解析しても、説明変数・被説明変数両方に影響を及ぼす重要な変数を忘れると間違った分析になってしまうことがあるということ。
(ちなみに、欠落変数の存在は、内生性を引き起こすだけでなく、系列相関の原因にもなりえます。)

社会は人間が把握しきれない様々な因果の鎖が極めて複雑に繋がっているので、全ての関連する変数をモデルにつっこむのは無理。ですので、常識的かつ現実的な範囲で因果の連鎖を考え、深い関係がありそうな変数をできるだけ多くモデルに入れこむということしかない訳です。

(ちなみに、一方でたくさん変数を入れると「多重共線性」(マルチコ)の問題がでてくることが多いのですが、そうしたら、変数の除去、リッジ回帰などで対処すればよいので、過少変数がもたらす深刻な問題よりも対処しやすいと言えます。)

ただ、どんな研究・調査結果であっても、これまで気付かなかった新たな重要変数を入れこむことで結論が引っくり返ってしまう(みせかけの関係にすぎなかったことが分かる)可能性があることは、強く肝に銘じておく必要がありそうです。


③そのほかにも、説明変数に観測エラーが含まれる場合(Errors in variable model)や、セレクションバイアスがある場合などに、説明変数と誤差項との間に相関、つまり「内生性」が発生するようです。


以上のことから考えると、内生の言葉のイメージに一番近い「①の同時性」が発生するときばかりでなく、様々な場合で、説明変数と誤差項との間に相関(=内生性)が生じ、分析を難しくしてしまうことが分かります。