こんにちは、岡川です。
今回は、メディアなどのサイト内ページを分類する方法を紹介します。具体的に活用されているわけではありませんので、一つのアイデアとして捉えていただければ幸いです。理論的には随分簡単ですが、広告を出稿することを念頭に置いたデータドリブンなページ分類のアイデアとして考えていただければと思います。
このアイデアは、私の夢想が多分に含まれているので、何かご指摘あればTwitterまで(@hokagawa)までお願い致します。
1.ページ分類することのご利益
ページを分類する事によるご利益は次の通りです。
「ページにマッチした広告を出すことにより、ユーザーのニーズに沿った有益な広告となるため、購買行動を促進させることができる。」
例えば、結婚の記事のページには、結婚の広告を出せば、広告効果が高く、ユーザーにとっても有益な情報を考えられます。そのためには、各ページを「このページは結婚カテゴリ」などのように、ページを分類する必要があります。
しかし、ページの内容だけ見ても、様々な要素が含まれているので、一意的に特定の記事を結婚カテゴリであると断定することは難しいです。
2.ページ分類の考え方
以上の背景を踏まえて、ページ分類の考え方を次のように変えてみます。
「記事内容ベースから、記事を閲覧したユーザーの広告接触履歴ベース」
例えば、「結婚の広告をよく見ていたユーザーがよく見ているページは、結婚カテゴリである」と考えます。
この場合、記事の内容が「エステ記事であっても、その記事をよく見ていたユーザーが結婚の広告をよく見ていたのであれば、そのエステ記事は結婚カテゴリと分類」します。
3.ページ分類の考え方に沿った分類の方法例
以下では、ここまで述べた考え方を実現するための方法を紹介します。
前提としてデータを取らなければいけません。計測ツールとして、第三者配信などが活用することにより、データは取得できます。例えば、日本の第三者配信ベンダー例は次の通りです。
・Fringe81社
・ロックオン社
上記のようなアドテクツールを使うと、以下のようなユーザー行動データが取得できます。これを図示したものが、下の絵です。(Uはユーザー、adは広告、pはページの意味です。)
例えば、ユーザー1は広告1と2に接触しており、かつページ1と2と3に接触しているので、線がつながっています。
次に、この絵を数学的に表現すると下の表になります。数学的には行列表現です。
ここで、Aはページとユーザーの対応です。行はページ、列はユーザーを表しています。
例えば、1行1列は1ですが、これは絵でいうと、ページ1とユーザー1がつながっている事を意味します。1行2~4列はゼロですが、これは、ページ1はユーザー2~4がつながっていない事を意味します。
この行列Aの列を合計して1になるように調整した行列がSです。これは後ほど使います。
次に、Tでユーザーと広告の対応を表現します。行はユーザー、列は広告を表しています。
例えば、1行1~2列は1ですが、これは絵でいうと、ユーザー1と広告1~2がつながっている事を意味します。1行3列はゼロですが、これは、ユーザー1と広告3がつながっていない事を意味します。
ここまで準備できたら、ここで数学的な処理(行列の掛け算)をします。SとTの掛け算して、Uという行列を新たに作ります。
ここについては、算数なので説明はできませんが、wikipediaには親切な説明がありました。
行列の掛け算
・Wikipedia(行列)
このUと、掛け算の意味を、絵で説明すると以下のようになります。
広告に接触した寄与の流れを、繋いだ線を下流に向かって均等に割り振ることに対応しています。つまり、広告の寄与をそれを見たユーザーを媒介として、そのユーザーが閲覧した各ページに割り振っています。全ての広告からの寄与の流れをすべて合計した数値を表現しているのが、Uという行列です。
この行列Uを、行へ分解すると5つのベクトルができます。
例えば、P1は広告1と2からの寄与がそれぞれ1/3で、広告3からの寄与が無しです。
4.データの見方
具体例として、広告が以下のような種類だったとします。
広告1は不動産系
広告2は結婚系
広告3はコスメ系
※広告を分類することは、ページを分類するよりもはるかに簡単です。
すると、ページ1は不動産と結婚カテゴリに、それぞれスコア1/3が付きます。不動産と結婚に関係した広告を見たユーザーがよく訪れるページなので、それらの広告を出すことが良いと考えられます。結婚を機に、不動産を探している、そんなユーザーが見ているのがページ1と意味付けできます。
メディア内に出稿する広告(純広告)の広告クリエイティブの制作にも役立ちそうな情報です。
その他のページについても、それぞれ定性的な説明ができるため、広告出稿に活かすことが可能です。
5.おわりに
今回は、記事を閲覧したユーザーの広告接触履歴ベースでのページ分離を紹介しました。この分類を元に、逆にユーザーの分類やターゲティングができます。
それについては、次回以降で紹介しますので、宜しければご覧ください。
以上
終わり