Y=α+βX+e
この式に最小2乗法を適用して回帰分析をすると、
が得られますが、この場合のXと誤差項eは無相関であることが仮定されています。
もしXとeが相関していると、βは一致推定量ではなくなります。
ここで、Xと相関し、eとは無相関の操作変数Zを式の両辺に作用させることによって、βを一致推定量にすることができます。
〇ここで私の疑問
Xがeと相関するため、その代わりにeと相関しないZを持ってきて操作変数推定するんだったら、最初からZで最小2乗推定すればいいのでは?
〇一週間ほど考えてたどり着いた答え
それだとYの説明変数であるXを無視して全く別の説明変数としてZを採用したことになる。Xは説明変数として外せないがeと相関してしまうので、その影響を除くために、eと相関せず、なおかつYに直接影響を与えず、Xを通じてのみYに影響を与える操作変数Zを考えるということ。
XとYの双方にZを作用させることによって、係数βの反応を観るという感じでしょうか?
そして、内生性の生じる例の一つとして、同時方程式における内生性の問題があります。
例えば、
C=α+βY+e・・・(1)
Y=C+I・・・(2)
C:消費、Y:国民所得、I:投資、e:誤差項
という消費関数に関する同時方程式を考えます。
(1)式を(2)式に代入して、式を整理すると
Yはeの関数のため、(1)式のYとeは確かに相関しています。
(1)式のYの操作変数として、(2)式のIを使うと、
同時方程式の識別のための次数条件(必要条件)については、文献によって微妙に異なる表現で説明されているため、なかなか理解しにくいと思いますが、私は下記のとおり整理してみました。
なお、ここで、
・内生変数:誤差項と相関を持つ変数
・外生変数:誤差項と相関を持たない変数 です。
〇同時方程式の識別のための次数条件(必要条件)
k:その方程式に含まれない外生変数の数(モデル全体に含まれる外生変数の数-その方程式に含まれる外生変数の数)
g:その方程式に含まれる内生変数の数
k=g-1 丁度識別
k>g-1 過剰識別
k<g-1 識別不能
gからの-1は被説明変数(左辺の内生変数)を除くためで、要するに、その方程式の右辺の内生変数の数と、その方程式に含まれない(モデル内の別の方程式に含まれる)外生変数の数が一致したときが丁度識別
その方程式に含まれない外生変数を操作変数として利用することによりβの一致推定量を得ることができるということです。
推定量の一致性がないということは、得られたデータと整合するβが無数に存在してしまうということで、このβの値を特定するためにどうすればいいのかというのが識別問題です。