さて、「企業再生の現場から (7)市場規模と成長性」のコーナーで、市場規模の将来予測をする統計学的な手法として「重回帰分析」という方法がある、と書きました。今回は、重回帰分析について解説してみます。企業再生の話とは、ちょっとはずれてしまいますので別のコーナーにしました。
回帰分析というのは、よく見たり効いたりする分析方法だと思います。エクセルでも簡単に分析し、グラフを作成することが可能です。
下の図は、新宿からの直線距離(中央線沿線)と公示地価の関係をプロットし、エクセルで近似直線を引いた図です。
この直線は Y = -9.3824X + 515.38 という式で表されますが、Xは「説明変数」と言い、この場合、Xには「新宿からの直線距離」が入り、Yには公示地価が入ります。
つまり、この式に新宿からの直線距離を入れれば、その場所の地価が大体わかる、というわけです。
R2 は決定係数 (Rは相関係数)と呼び、「1」に近いほど、相関関係が深いということを示しています。
この式のR2 = 0.8454 というのは、相関関係がすごく深いとはいえませんが、まずまずの結果ではないでしょうか。
「都心から遠くなるほど地価が安くなる」というのは実感としても納得できますよね。但し、単純に「新宿からの距離」だけで地価が決まるわけではありません。駅からの距離や交通手段、周辺の利便性などいろんな要素で決まるので、距離と地価の2種類のデータ間だけの相関関係は、「まずまず」という水準にとどまっているのです。
前述のような2種類のみのデータ間の関係式を単純回帰式と呼びますが、やはり1つだけの説明変数で需要予測や価格予測をすることは誤差が大きくなってしまいそうです。
そこで、複数の説明変数を設定し、予測の精度を高めようというのが「重回帰分析」です。
数式で表現すると、 Y=μ+aX1+bX2+CX3+dX4+・・・・・ となります。
μは定数、X1 、X2 、X3 、X4 は説明変数、a、b、c、d ・・・・は説明変数の係数です。
式だけ見ていてもわかりにくいので、実際の事例を使って説明します。
ここでは、高速バスの需要予測(新規に高速バスの路線を設定した場合、どのくらいの需要が見込めるか)を「重回帰分析」を使ってやってみます。
A市とB市を結ぶ高速バスを走らせる場合、
① 1日に何便くらい運行させるとよいか
② 運賃はいくらくらいに設定するのがよいか
というのを想定するのが目的です。更には、①、②を想定した場合のコストを考えて、採算が取れるかどうかを判断するのが、最終目的になります。
これを予測するためには、まず、
③ A市とB市の間の旅客流動はどのくらいあるのか
④ その中で高速バスのシェアはどのくらい取れるのか
を考えなければなりません。
A市とB市の間の旅客流動については国土交通省が「全国幹線旅客純流動調査」という調査を5年に1回実施しています。全国津々浦々というわけにはいきませんが、主要な都市間の流動は網羅されています。また、主だった交通手段として、何を使ったか、もわかります。
このデータを使ってA市とB市の規模や距離に類似した都市間の旅客流動及びその移動手段の交通機関のシェアをまず把握するのです。
次に、「交通機関のシェア」がなぜそうなっているのかを考えて見ます。皆さんも移動手段を選択するときに何を要素とされますか。
● 2地点間の距離
● その交通機関を選んだ場合移動にかかる時間
● 運賃
● 1日にどのくらい運行しているかという利便性
● 電車の場合は乗り換え回数(不便さ)
といったことではないでしょうか。
快適性といった要素もあるでしょうが、これはなかなか定量化が難しいので、無視します。
つまり上記の5つが「高速バスによる移動需要予測をするための説明変数候補」ということになります。
説明変数は、全てを使わなければならない、ということではありません。組み合わせにより、重回帰式を作ってみたときに、実績値と最も相関が高い式(前述のR2 が最も「1」に近くなる式 ) になるような組み合わせにすればよいのです。
ちなみに説明変数が多ければ多いほどR2は「1」に近づきやすい、という特性があります。
また、それぞれの説明変数ごとの相関関係が高いのは、あまり良い予測式ではありません。
これは「多重共線性」と言いますが、要するに、説明変数間の相関が高い場合は、それぞれの説明変数を無関係に独立して変化させることができなくなってしまうからです。
ちょっとわかりにくくなってしまったので、予測式(重回帰式)を設計し、需要予測を行うまでをフローチャートに示しておきます。
長くなってしまったので、具体的な重回帰式の説明はページを変えることにします。

