今回の記事も前回に引き続き、計量時系列分析のイメージを持ってもらおうという内容です。
今回も安井が担当いたします。
さてさて、前回はVARとインパルス応答関数使うと、
「ある事象が急に変化した時に、別の事象がその時と未来においてどの様な影響を受けるのか?」
が解りますという話を株の収益率の例でしました。
そして最後に「で、これってどうやって分析してるの?」と「で、これって広告とかマーケティングでどーやって使えるの?」
という二つの疑問を提示し、今回は「どうやって?」を解説しますという予告をして終わりました。
今回はどうやっての前半部分についての記事です。
2. 計量時系列分析の考え方
2-1. 時系列データと簡単な未来予測
VARとインパルス応答の解説の前に、それらの基礎となっている部分のイメージを掴む必要があります。
株価・キーワードの一日辺りの検索数・ディスプレイ広告のクリック数・PV数等々、世の中には時間が経過するごとに観測されるデータが大量にあります。これらの様に一つの対象を時間ごとに観察して得るデータを「時系列データ」と言います。
計量時系列分析とは、「観察された時系列のデータの動きを説明できるモデル(数式)を構築する」分析です。
なので、検索数で時系列分析をするという事は、日々の検索数の動きをモデル、つまりは数式で書き記そうという試みになるわけです。
もしここで作ったモデルが検索数の動きの特徴をよく捉える事が出来ていれば、そのモデルを利用する事で未来の検索数を上手く予測する事が出来るわけです。
ちょっと感覚を掴むために簡単な例を出してみます。
仮に一日ごとに1と-1を繰り返す時系列のデータがあるとします。
今日の値が-1であった時に、明日の値が幾つになるのか?という予測はこの場合非常に簡単でしょう。
これならわざわざ数式を使うまでもないのですが、今回はちょっとお付き合いください。
一日ごとに1と-1を繰り返すこのパターンは、前日の値に-1を掛けるという式で表すことが出来ます。
よって、観測されるデータをYとして書くなら、
Y_今日 = Y_昨日 * -1
という式で書くことが出来ます。
そして予測する際には、
Y_明日 = Y_今日 * -1
という式を解けば明日の値を予測することが出来ます。
今回なら今日の値は-1なので、明日の予測値は1という事になります。
この様に、過去の動きのパターンをしっかりと読み取ることが出来るケースであれば、数式はちゃんとした予測を行う事が出来ます。
もし、過去のパターンが人間では読み解けない様な複雑な物であっても数式がその特徴をちゃんと捉えてさえいれば、その数式の予測値は信用するに足りることになります。
※因みにどうやってその特徴をよく捉えている数式とやらを見つけるんだよ?という話も非常に重要でなのですが、解説が難しくまた長くなってしまう為に省略させていただきます。
残念ながら、このような方法では予測が上手く行かないケースが存在しています。
今まで説明していた事はには実は
「未来の自分を予測するのに十分な情報は、過去の自分にちゃんと含まれている」
という前提がありました。だから自分の過去の特徴を読み取って未来を予測しようというアイデアが正当化されていました。
しかしながら、この前提が崩れてしまう時、
つまり「未来の自分を予測する情報は、過去の自分だけでなく、他者の過去にも含まれている」
という状態では、ただ単に自分の過去の動きを探っていても上手く予測する事が出来ません。
例えば、検索数の予測をする際には、検索数の過去だけでなく、マス広告の情報が必要になるといったような状況です。
この様な状況で使われるのが、他者の過去の情報も使って自身の未来の予測をするVARモデルなわけです。
つづく。