こんばんは。同期の小笠原君がCriteoの記事でホームラン級の当たりを飛ばしてしまったためにものすごい焦りを感じている安井(@housecat442)です。
さて、セミナーシリーズも第五回を迎えました。
今回で手法の解説を終え、次回は事例の簡単なまとめを書かせて頂く予定です。
3-1. インパルス応答関数
前回までで
「一つの種類のデータを用いるモデルで上手く動きを表せないケースにおいても、VARモデルの様に他者の過去を使う分析モデルを使えばそれが可能になる」
という事を説明してきました。
さて、ではVARモデルを使ってデータを分析した後に何が出来るのでしょうか?
一番シンプルな使い道は今までお話ししてきた通り「予測」です。
が、広告業界では多くのケースにおいて、効果の検証を行う必要性があります。
つまり、ディスプレイ広告の表示回数が上昇した際に検索広告でのCVがどの位増加するのか?
言い換えれば「ディスプレイ広告の検索広告への間接効果がどの位あるのか?」という検証が必要なケースが多々あります。
こういった分析のテーマが有る際にVARの追加的な分析ツールとして用いられるのが「インパルス応答関数」というものです。
さて、今株価の収益率のパターンを発見して一儲けを考えているとします。
そしてイギリス・アメリカ・日本の収益率のデータをそれぞれ取得してきてVARモデルで分析したとします。
恐らくアメリカの金融市場が他の国に与える影響がより大きいと考えたあなたは、アメリカから日本への影響の度合いを知ればチャンスになると考え、「ある時のアメリカの金融市場での収益率の変化が、日本の当日・翌日・翌々日の収益率にどのような影響が有るのか?」という分析をインパルス応答関数で行いました。。
まずアメリカの金融市場で変化が起きた当日に着目します。
上の図はt=当日の影響を見ている代物です。
εは予想外の変化分を意味するもので、左からイギリス・アメリカ・日本での変化分となっています。
今はアメリカからの影響を考えているので、真ん中のアメリカのεが変わった時(つまり予想外の変化が起きた時)に他のεがどうなるかをまず見ます。それがアメリカのεから左右に伸びている矢印になります。
要するにアメリカの収益率に予想外の変化があると、その変化に左右されてイギリスとアメリカでも予想外の変化が起きてしまうという事をこの左右の矢印の部分で汲み取っています。※
yは収益率の変動を意味するもので、これもやはり左からイギリス・アメリカ・日本となっています。
当日の変動は、予想外の変化分と全く一緒の値になります。
さて、アメリカの収益率に予想外の影響があったとき、アメリカの収益率の変化は予想外の影響そのものとなり、イギリスと日本での収益率はアメリカの影響を受けて予想外の変化を起こすことを説明しました。(ややこしいですねw)
図で言うと今y(t)が3つ並んでいる所まで来ています。
さて、VARモデルでは互いの過去が互いの未来を予測できるという仮定を置いており、今はそのモデルに従って分析してます。
これはつまり、明日の変化は、今日の変化で予測する事が出来るという事になります。
よって、明日の日本の変化(y jp,t+1)は今日のイギリス・アメリカ・日本の変化から計算が可能になります。
また、明日のアメリカの変化(y us,t+1)は今日のイギリス・アメリカ・日本の変化から計算が可能になります。
そして、これは明後日においても明々後日においても同じことが言えます。
つまり、明後日の日本の変化は、明日のイギリス・アメリカ・日本の変化から計算が出来ますし、明々後日の日本の変化は明後日のイギリス・アメリカ・日本の変化から計算が出来るという事です。
これを絵でかいてみると、時間の進行とともにイギリス・アメリカ・日本の影響が交差し合って絡み合っている状態になります。(上の図の左側です)
この絵は、「ある時点でアメリカに何らかの変化があった時に、同時点と未来のイギリス・アメリカ・日本がどの様な伝搬で影響を受けるか?」というものを表しています。
もし、「ある時点でアメリカに何らかの変化があった時に、同時点と未来の日本がどの位影響を受けるか?」という事を知りたいのであれば、上図の赤線で囲った部分のみを計算して取り出すことで可視化する事が出来ます。
それが絵の右側に当たる図です。
こちらの図は横軸が時間で、縦軸が影響の度合いを示す図になっています。
同時点(t)ではアメリカから日本への影響はないものの、明日(t+1)・明後日(t+2)ではアメリカからの影響を受けて日本の株の収益率が上がる事を示しています。
3-2. インパルス応答関数のインターネット広告への応用
さて、このVARモデルとインパルス応答関数を利用した分析のアプローチはインターネット広告においても応用されています。
Pavel Kireyev, Koen Pauwels, Sunil Guptaの3名はディスプレイ広告と検索連動型広告の予算配分を考慮するためにこのアプローチを利用するといった論文を書いています。
「Do Display Ads Influence Search? Attribution and Dynamics in Online Advertising」
by Pavel Kireyev, Koen Pauwels, and Sunil Gupta
彼らは「検索広告での一週間辺りのIMP」「検索広告での一週間辺りのクリック」「検索広告での一週間当たりのCV」「ディスプレイ広告での一週間当たりのIMP」「ディスプレイ広告での一週間当たりのCV」という五種類の週別データを利用してVARモデルの分析を行い、インパルス応答関数を使いました。
下がその4種類の結果になっています。
※出典:Do Display Ads Influence Search? Attribution and Dynamics in Online Advertising, Pavel Kireyev, Koen Pauwels, and Sunil Gupta, February 9, 2013, Harvard Business School Working Paper
左上と右上の図a,bは、自分から自分へ、つまりサーチのクリックが増えればその後のサーチのクリックも増加し、ディスプレイの表示回数が増加すればその後のディスプレイの表示回数が増加するという効果が可視化されています。
左下はの図cは、検索広告のクリック回数が増加した際にディスプレイ広告からのCVが増加するか?という図です。こちらに関しては「効果無し」という結果が出ています。つまり、検索広告からディスプレイ広告への効果は無いと考えられます。
恐らく一番面白い結果は右下の図dで、ディスプレイ広告のimpが増加した際に検索広告でのCVが増加するという結果が出ています。
この研究の様にVARモデルとインパルス応答関数は、インターネット広告での応用も十分に可能です。
また、ユーザー行動データをもとにしない分析なので、そういったデータが取得できない「デバイス間の関係性の分析」や「マス広告とウェブ広告の関係性の分析」といったテーマにおいての応用が可能です。
次回からは第2部の内容を手短に説明してゆきます。