ビジネスへのデータ活用・・・そもそもデータが無いときは?

賢い企業は、回帰分析でビジネスの予測精度が上がることを
知っている。そのため、自社の業務効率・効果を上げるために、
自らの業務データを、積極的に活用しだしているのだ。

しかし、分析対象のデータがそんなに都合よく用意されている
ことばかりではない。データが無い場合は、どうしているのだろうか。

・・・そんなとき、企業は独自のデータを自ら作っているのだ。
それも、積極的に。


コイン投げをする企業


まず一般に言えることとして、人はそれぞれ購買様式が異なる。
ある人は、価格が安いことが全てかもしれないし、ほかのある人は、
丁寧な応対やサポートで購買を決めているかもしれない。

キャンペーンのタイトルに、「ポイント10倍キャンペーン」 と書くのが
良いのか、「10人に1人、1,000円キャッシュバック」と書くのが良いのか。

仮説は立てられるが、実際にどのパターンがどれくらい効果的なのかは
やってみるまで分からない、これが事実だ。

ならば、試してみればよい。
インターネットの普及に伴い、このような検証-無作為テスト-は
非常にスピーディーにかつ安価に行えるようになった。


アマゾンとキャピタル・ワンの例

amazon.com は、トップページ中心に無作為テストを頻繁に
行っているので有名だ。

キャンペーン品の表示は動画が良いか、静止画が良いか、
価格を横に表示するのが良いか、中に表示するほうが良いか、
おすすめを表示するだけにするか、購買率も示した方が良いか
・・・などなど。

amazon.com にアクセスした人に異なるパターンの画面を配信し
そのユーザが、どのような操作を行ったかを蓄積するのだ。

2パターンのテストであれば、それぞれ1,000人ずつに試し、
その結果をデータとして蓄積する。このようなテストを、
アマゾンは年間数万件行いながら、
ビジネスに使用するための分析用のデータを、自ら作り出して
しているのだ。

また消費者行動の分析では、消費者金融で非常に強いビジネスを
展開している、キャピタル・ワンも有名だ。

2006年には、キャピタル・ワンは 2万8000件もの異なる無作為テストの
実験をしたと言われる。

融資利用者で延滞も無い、プライム層にあたるセグメントには
「初年度利息2.9%」 と書くのが良いのか、「あなただけの期間限定
サービス」と書くのが良いのか。

見込み客をグループに分けて、それぞれのパターンを試し、
どちらの成功率が高いのかを実地に調べていくのだ。

企業は、このようにして統計解析の元となる、消費者ごとのデータを
作り出しているのである。

---

最近、インターネットの更なる進化と普及に伴い、
この分野はさらに興味深い兆候・展開が見られるようになってきている。

次回は日本企業の例を出しながら、インターネット上で起こっている
新しいタイプのデータ活用の事例と、近未来像について見てみたい。




ランキングという「おすすめ」

前回まで話題に挙げた Alexa が提供しているような人気ランキングは、利用者にとってずいぶんとありがたいものです。

たとえば、どの映画をレンタルするか、どのWebサイトを使うのがよさそうか、大まかな判断をすぐに負荷なくできるからです。
しかし、ランキングはただのランキング、誰にとっても同じ一覧でしかありません。


一歩先に進んだ、カスタムされた「おすすめ」

ランキングも含め、こうした「傾向解析システム」は、すでに一歩先に進んでおり、自分と傾向が似ている人が、どのようなアイテムを面白がっているか教えてくれる機能(=協調フィルタリング機能)が、一般的になりつつあります。

(たとえば、アマゾンの「この本を買った人はこの本も買っています」というレコメンデーションが有名ですね)

こうした協調フィルタリング機能は、利用された事のある方はよくわかると思いますが、ランキング以上に、非常に便利です。

そして、この機能は、利用者にとって便利なだけでなく、提供者にとっても、ビジネスの成果を引き上げる効果をもたらしています。

たとえば、映画レンタルの Netflix ではレンタルされた映画の 2/3 近くは、この協調フィルタリングによって、おすすめされたものになっており、利用者それぞれに対して違う映画を推薦できることによって、保有する5万本の映画のうち、9割以上が月1度はレンタルされているそうです。

つまり、ランキングによるベストセラーの一覧は、ビジネス的に見ると、利用を一部のアイテムに集中する効果を持ってしまいますが、カスタム化されたおすすめは、利用を多様化する効果を持っています。

いわゆる、クリスアンダーソンが提唱した「ロングテール」効果ですね。

このように、協調フィルタリングは、利用者にとっても非常に便利ですが、活用によって提供者にとってもビジネス成果を大きく向上させるものになっています。


人の代わりにシステムが考えてくれる時代

こうした機能は、「回帰分析」を中心とした統計解析によって実現されています。
ちなみに、回帰分析自体は、何世紀も前から行われていた手法で、特に理論的には目新しさはありません。

それが、CPU、ネットワーク、そして何よりストレージ容量の急速な増大によって、大量データをシステムで解析処理できるようになったこと、そして、インターネットを介して、解析データを様々な場面で再利用できるようになったことによって、一気に多くのビジネスの世界で活用されるようになりました。

インフラ・テクノロジーの進歩によって、広く普及してきている例といえると思います。

先のおすすめの話もそうですが、
いまや、こういった傾向解析のデータに基づく意思決定はいたるところで台頭してきています。

たとえば、固有名は割愛しますが

・あるレンタカー会社や損害保険会社は、
 クレジットカードの返済実績の低い人に対しては、
 サービスを拒否したり、高い料率を提示しています
 (傾向解析によって、
  返済実績の低い人は、事故を起こしやすいことが
  わかっているため)

・ある航空会社は、フライトがキャンセルされると、
 別便の空席を、他社に乗り換えられるリスクの高い顧客を
 傾向解析し、常連客をさしおいて
 乗り換えリスクの高い顧客から、優先的に案内を行っています

などなど。

かつては、これらは熟練者の知恵、専門家の知恵・ノウハウによってカバーされていた非常にスキルフルな業務だったでしょう。

それが、大量データを背景とした統計解析に代替されることによって、人の位置づけが大きく変わってきています。

専門家による、経験と直感を、システムが凌駕する場面が、いたるところで起きており、それがビジネスを大きく変えてきています。

次回は、実際のビジネスでどこまでどのような変革が起こっているか、さらに実例を取り上げながら、ご紹介しようと思います。


人気ブログランキングへ  ←面白かったりタメになったら一票(クリックでOK)




前回の記事では、Alexa がトラフィック情報を収集する際の
メカニズムについて、概要を説明しました。

ポイントとしては、Alexa の情報は、Alexa Toolbar を介し

「少なくは無いが、かといって非常に膨大でもない
 あるPC環境のユーザーからのみ収集」

されるデータだということです。


方法としては、テレビの視聴率算出に似ていますが、
セグメントがAlexa Toolbar をインストールしている層に限定される
という点がポイントです。


---


実は、この AlexaToolbar は、
過去には Internet Explorer や Netscape Navigator といった、
主要なブラウザすべてに標準で組み込まれていました。


つまり、ある時期 ( IE であれば、 IE 5 ) までは

「Alexa Toolbar をインストールしている層
 = インターネット上のほぼ全てのユーザ」


という図式がなりたっており、
非常に膨大かつ高精度のトラフィック情報を収集していたのです。


しかし、これは普通に考えれば、非常に横暴なことです。
あるユーザーがアクセスしているサイトの情報を一定の個人情報とともに、
無許可で収集していたのですから。


これが、インターネット上で問題になり、Microsoft は、IE6 以降は、
Alexa Toolbar の標準機能への組み込みをやめています。
今では、機能として標準採用しているブラウザはありません。


このような経緯があり、利用者が大幅に限定されてしまった
Alexa Toolbar ですが、
それでも、特にある層においては非常に高い利用率を誇っています。

それは、どの層でしょうか?


---


ネットサービスの開発や、Webマーケティングを生業としている人たちです。


これはごく自然なことです。
Alexa Toolbar を利用すれば、各サイトの詳細なトラフィック情報や
機能の利用情報を、簡単に得られるのですから。

そりゃ、ほぼ 100% の人が利用していると言っても過言ではないくらいの普及率です。


その結果、何が起こっているか。
IE6以降、 Alexa の統計情報に徐々に特徴的な変化が起こりました。


Webマーケティングに関連するサイト、SEO 関係のサイト、
ブログなどのランキングサイトのAlexa ランキングがある時期を境にあがってきた
という結果になってしまってきています。


また、検索やコミュニティサービスに関しても、インターネットにある程度
精通した人が利用するサイトの方が、Alexa ランキングが高い傾向にあります。


---


つまり、繰り返しになりますが、
Alexa の統計情報は、あるフィルターを通して収集しているので、
そのフィルターの特徴を差し引いて見る必要があるということです。


具体的には、Alexa Toolbar を利用している層が偏ってきていることから、
SEOや、ネットサービス関連のページはランキングが高くなる傾向があり、
単純に、他のサイトと比較すると、現状を見誤ってしまいます。


基本的に同ジャンルのサイト同士の比較という利用に限定するのが、
現状のAlexa 統計情報の正当な活用方法なのだろうと、考えています。

上記を意識してみることで、 Alexa はまだまだビジネスの第一線で
利用できるデータ精度を有していると思います。

それを具体的に検証するには、
ランキング Top100 位のサイトを対象に、カテゴリごとに分けた上で、
トラフィックの推移と、なぜそのトラフィック推移が生じたか(機能が増えた、
キャンペーンを行った...など)を分析してみるのも面白いかもしれませんね。
いずれちょっとやってみようと思います。


次回は、Alexa と双璧をなす トレンド把握のためのサービス
Google Trends を取り上げます。


それでは、今回はこのあたりで。


人気ブログランキングへ  ←面白かったりタメになったら一票(クリックでOK)