昨日に引き続き、SPSSの本を読んでいました。
計量経済学の宿題を回帰分析でしようと思ってます。
把握した内容をとっても簡単ではありますがまとめてみました。
------ 入力 ------
方法:
・強制投入法
-すべての変数を一括して投入。モデルの良否は分析結果で検証。
・ステップワイズ法(変数増減法)
-F値またはF値の有意確率に従ってコンピュータが自動的に有効な変数を選択。
多重共線性も回避。
・強制除去法
-回帰式に入れたくない変数を強制的に除去して残りの変数で重回帰分析を行う
・変数減少法
-指定の変数をすべて投入後、除去基準を満たす変数がある間、
従属関数と最も小さい偏相関を持つ変数を除いた変数で重回帰分析が繰り返され、
最終的に有効な独立変数だけを選択
・変数増加法
-入力基準に合う変数がなくなるまで指定の変数が投入され、
最終的に有効な独立変数だけを選択
統計-残差:
・Durbin-Watsonの検定
-時系列データを用いた重回帰分析を行った際に残差間に系列相関があるかを検定。
(2に近ければ系列相関はないと判断)
ケース選択係数:
特定の対象のみを分析したい場合、
対象の変数を指定し、「規則」をクリックして表示されたダイアログ中に値を入力する。
質的データ:
扱いたい場合、「他の変数への値の再割り当て」よりダミー変数を作って量的変数へ変換。
------ 結果 ------
R:
重相関係数(観測値と予測値の相関係数)
R2乗:
決定係数(回帰モデルの説明力)
調整済みR2乗:
上記の決定係数は説明変数の数が多くなればなるほど大きくなるため、
説明変数の数を除去して算出された決定係数。
推定値の標準誤差:
「残差平方和/残差の自由度」の平方根。(値が大きいと重回帰式の予測精度が悪い)
F値:
回帰の平均平方を残差の平均平方で割った値。
その隣の「有意確率」は、「すべての回帰係数が0」という帰無仮説を誤って棄却する確率。
(低ければ「すべての回帰係数が0ではない」確率が高い)
非標準化係数:
得られた重回帰式の定数項と回帰係数。
標準化係数:
変数を標準化(z)して重回帰分析を行った時の回帰係数。
t値:
非標準化係数/標準誤差。定数項や回帰係数のt検定に用いる。(有効な変数かそうでないか?)
その隣の「有意確率」は、「この回帰係数が0」という帰無仮説を誤って棄却する確率。
(低ければ「この回帰係数が0ではない」確率が高い)
Bの95%信頼区間
信頼度を95%とした時に母回帰係数の値がとる範囲。
相関係数:観測値との相関係数。
・ゼロ次-ピアソンの積率相関係数。
・偏-偏相関係数
(他の変数が対象の変数と被説明変数に及ぼす影響を除去した、対象の変数と被説明変数の相関係数)
・部分-部分相関係数
(他の変数が対象の変数に及ぼす影響を除去した、対象の変数と被説明変数の相関係数)
共線性の統計量:
多重共線性を診断するための数値。
許容度が小さいほど、他の独立変数と強い線形関係があると判断される。
VIF=1/許容度。最大4、良好な状態で2未満が目安。
(本ではサンプルデータと画面と分析結果に対する詳細な説明があってわかりやすいのですが
文章で要約してみると一般的な内容になりますね・・・)
計量経済学は数学苦手な私にとって難しく、ほとんど身についていないと思っていましたが
授業で聞いたために本の説明が割とスムーズに読めた部分もあって
習得度全くのゼロではなかったんだな~と少しうれしくなりました。