パネルデータにおける固定効果モデルについて自分なりのまとめを書きます。

 

面倒くさそうな式が出ますが、すべてカンタンに解説します!

パネルデータは個別のデータを時系列でまとめて見る場合に使います。

固定効果モデル(Fixed Effect Model)はそのときにとても有用です。

 

HPはハウスプライス、住宅価格です。crimeは犯罪発生率、umempは失業率、この二つは住宅価格に影響を与えそうという仮説が立てられます。

αは地域の特性、例えば文教地区であるとか歓楽街の近くとかです。uは誤差項。ここまでが第一式。

 

ここで数年のスパンを考えて平均を取ると、住宅価格は 1/T に Σの1からTまで。

面白いのはαのt、つまり時間効果がここで消えてくれるんですね、分母もαの前の年数も3年なら3年で同じですから。これは文教地区がいきなり歓楽街に変らないという地域の特性という事情を数式で表しただけとも言えます。

 

それから第一式から平均の式の差分を取ります、それが第三式。αが見事に消失していますね。そして最終式、住宅価格のチルダはβが二つだけ、つまり犯罪発生率と失業率の住宅価格に与える影響を、地域特性αを消して、より精確に表せられる、誤差項uの差分は消えませんのでuチルダは忘れないでください。これが固定効果モデルです。

 

この方法で回帰したときのRスクエア、決定係数には(within)と注釈が付いています。以前から疑問に思っていたことが、平均との差分を取るという高校数学で理解できて脱力しました。

 

最後にまた動画と本の宣伝です!

YouTubeへ移動!

 

アマゾンへ移動!