1.単回帰式と重回帰式を使って
できることとできないこと
重回帰式に入る前に、もう一つ、
単回帰式と重回帰式を使ってできることを
ご紹介します。
前回、
下表のようなxiとyiのデータの組み合わせで
単回帰式を導き出しました。
このような単回帰式でも、重回帰式でも、
「予想」に使うことができます。
例えば、
データにはないx=7の場合のyの値を
単回帰式
y=0.9024x+0.3659
を使って求めれば、
y=0.9024*7+0.3659
=6.6829
となります。
しかし、
x=10の場合のyの値を求めることは
できません。
なぜならば、
上表のデータでxの値は2~9の範囲しか
実在しません。
導き出された単回帰式は2≦X≦9の
範囲内で導き出されたものであるため、
この範囲でしか適用できないからです。
このように、xのデータが実在する
範囲内で単回帰式又は重回帰式を
適用してyの値を予想することを
「内挿」と言います。
逆に、xのデータが実在する
範囲外で単回帰式又は重回帰式を
適用してyの値を予想することを
「外挿」と言います。
外挿はxのデータが実在しない範囲での
予想になりますから、予想を誤る可能性が
高くなります。
2.重回帰分析の前準備Ⅰ
多変数データの相関
重解析分析は、1種類の被説明変数が
複数の説明変数に従属している場合の
データを取り扱います。
例として、今回から
「賃貸マンションの物件データ」を扱います。
変数として、
バス(分)、専有面積(m²)、築後(年)、
並びに賃料(千円)の組み合わせに
なっております。
※最下段の21番目のデータは、
今は使いません。
これら4種類の変数にどのような相関が
あるのかを、「データ」内にある
「データ分析」を起動させ、
その中の「相関」で調べました。
4種類の変数データをラベルごと選択し、
「先頭行をラベルとして使用」に
チェックを入れました。
これで「OK」をクリックすると、
各々の変数同士の相関係数が出ました。
以前触れたように、
相関の有無の判断基準として、
相関係数rの自乗が4/(データ数+2)よりも
大きいときに「相関がある」と判断できます。
今、扱っているデータ数は20ですので、
4/(データ数+2)=4/(20+2)=0.1818
となります。
上記の相関分析結果の
赤文字で表した部分、即ち
(1)バスと賃料
(2)専有面積と賃料
(3)築後と賃料
の3つに相関があると判断されました。
なるほど、不動産価値はこうして
決まるのだなあと、すんなり
腑に落ちました。(笑)
3.重回帰分析の前準備Ⅱ
各相関の単回帰分析
並びに散布図
次は上述3種類の相関につき
単回帰分析並びに散布図の作成を
行いました。
(1)バスと賃料の回帰分析
並びに散布図
「分析ツール」の「回帰分析」を起動し、
データ範囲は以下の通り、
赤の破線で示す被説明変数yに「賃料」、
青の破線で示す説明変数xに「バス」を
選択し、先頭行を「ラベル」として
使いました。
分析結果は以下のようになりました。
最下段の表の赤破線で囲んだ部分に
切片a=87.003、傾きb=-1.3106が
記載されております。
次に、同じ相関を散布図に示します。
上記データ範囲を予めドラッグして
おいてから、「挿入」から
「散布図またはバブルチャート」、
さらに「散布図」を選択し、
散布図を表示させたら軸ラベルを表示させ、
タイトルと軸ラベルを書き換えます。
次にデータ点を右クリックして
「近似曲線の追加」を左クリックし、
「線形近似」を選んだら、
その下にスクロールして
「グラフに数式を表示する」と
「グラフにR-2乗値を表示する」にチェックを
入れます。
Rとは、相関係数rのことを指します。
こうして、散布図に単回帰式と
相関係数の自乗値が表示できました。
切片a=87.003、傾きb=-1.3106、
いずれも回帰分析の結果と
一致しております。
※赤破線で囲んだ部分同志を比較すると
わかります。
やはりバスの乗車時間が長く、
駅や繁華街から遠いところは賃料も安く、
我々でも入れるわけです。いや、
そんなところしか入れません。(涙)
(2)専有面積と賃料の
回帰分析並びに散布図
次に、同様の手法で
専有面積と賃料の相関についても
回帰分析と散布図作成を試みました。
データ範囲は以下の通り、
赤の破線で示す被説明変数yに「賃料」、
青の破線で示す説明変数xに「専有面積」を
選択しました。
結果は以下の通りです。
切片a=6.4582、傾きb=1.4776、
いずれも回帰分析の結果と
一致しております。
住まいは広いに越したことはありません。
しかし、広い分だけ賃料も敷居も
高くなるものです。(涙)
(3)築後と賃料の
回帰分析並びに散布図
次に、同様の手法で
築後と賃料の相関についても
回帰分析と散布図作成を試みました。
データ範囲は以下の通り、
赤の破線で示す被説明変数yに「賃料」、
青の破線で示す説明変数xに「築後」を
選択しました。
結果は以下の通りです。
切片a=88.988、傾きb=-1.6673、
いずれも回帰分析の結果と
一致しております。
賃貸も持ち家も築後年数が経てば経つほど
安くなってゆきます。
築18年の我が家は入居時の購入価格から
いくら価格が下がりましたことやら。(溜息)
本日はここまでとします。
ご精読、ありがとうございました。
次回は、「賃料の重回帰分析」に入ります。
まだタグチメソッド本体には
触れませんが、これら回帰分析は
Excelでのタグチメソッド解析に
役立つ基幹技術になります。
ご期待ください。
<参考文献>
広瀬健一・上田太一郎/共著
「Excelでできるタグチメソッド解析法入門」
同友館
本書籍の購入ご希望の方は、下記のバナーを
ご利用ください。
<お知らせ>
ただ今、楽天市場でお得なイベント
絶賛開催中です。