【朝コラ】ビッグデータで身近になった予測分析 1/2 | (仮)アホを自覚し努力を続ける!

(仮)アホを自覚し努力を続ける!

アウグスティヌスの格言「己の実力が不充分であることを知る事が己の実力を充実させる」

“象牙の塔”は解放されつつある
(アレン・バーナード)


 ビッグデータの取り組みが失敗する要因の1つとして、「企業に有能な分析担当者が存在しない」ということが挙げられる。特に予想分析となると、統計学者やデータ科学者といった専門家の能力が必要とされてきた。ところがそうした状況は、ビッグデータへの関心の高まりと、ビッグデータ関連テクノロジーの成熟によって変わりつつある。


 従来の予測分析は、日々の意思決定が下されるビジネスの現場から遠く離れた“象牙の塔”で、統計学者やデータ科学者の手によって行われるものとされてきた。しかし昨今、ビッグデータを活用する動きが広まるにつれ、以前と状況が変わりつつある。

 大量のデータ・ストリームがオンラインで生み出され、BIやCRM、ERPといった既存の企業基幹システムに取り込まれるようになった。そのため、企業に多大な利益をもたらすと期待されながら、これまで漠然としか描くことのできなかった顧客像をより明確に把握できる可能性が高まっている。一般のカスタマー・サービス担当者や営業担当者がその恩恵を受けるまでには至っていないものの、米国IBMや米国マイクロストラテジーなどの分析ソリューション・ベンダーが、近い将来の普及を目指して開発を進めている。


現場担当者によるデータ分析が可能に

 予測分析が身近になると、どんなメリットが考えられるだろうか。例えばカスタマー・サービス担当者は、ある顧客との関係を継続する価値、あるいは格付けを上げる価値があるかどうかを自分で判断できるようになる。また現場の営業担当者であれば、週末に開催されるジャズ・フェスティバルに備え、来場予定者のFacebookやTwitterへの投稿内容から好みを判断し、小売店のワインの品揃えを調整することができるだろう。

 ビッグデータにより、現場レベルのマネジャーも、これまでコホート分析や回帰分析のために利用されてきたツールを使って非トランザクション・データを分析し、店頭に並べるべき商品やそのタイミングなど、戦略的で長期的な意思決定を下せるようになりつつある。

 ただし、それによって従来のBIツールが不要になるわけではないと、調査会社の米国ガートナーでBI担当アナリストを務めるリタ・サラム氏は指摘する。それどころか、ビジネスにとってのBIの価値や有用性はビッグデータによって一層高まるという。

 「ビジネス分析では常に過去を振り返ることが必要となるが、ビッグデータを利用する場合は、その傾向がさらに強くなる。BIは不要になるどころか、ビッグデータによってその存在感をさらに高めることになるだろう」(サラム氏)

 実際のところ、BIツールを使用しなければ、分析初期段階での発見が長期的に見て正しいものかどうかを実証できない。例えば、ある地域で赤い財布が青い財布よりも売れるかどうかを分析したとする。初期分析ではイエスという答えが出た。理由は、直近の四半期に赤い財布の売上げが過去最高を記録しているからだ。果たしてこの結論は正しいのだろうか。

 導き出された評価は、相関関係に基づくものであって、因果関係に基づくものではない。BIツールで収集されたトランザクション履歴を詳しく見てみると、赤い財布の売上げが増加したのは、店舗における商品の配置換えによって、赤い財布が目の高さに陳列されるようになったことが原因だと分かるかもしれない。

 このためIBMの最新テクノロジー担当ディレクターを務めるデビッド・バーンズ氏は、HadoopやMap/Reduce、Rなどのビッグデータ関連テクノロジーから得られた結果について、あくまでも過去の洞察として見るようになっている。ビジネスにとって重要な意思決定を、Twitterストリームの感情分析に基づいて下すようなことはしたくないからだ。


すぐに成果が得られるソーシャル分析

 もちろん、ソーシャル・メディアの情報にも価値はある。例えば、カナダの人気歌手ジャスティン・ビーバーのファンの間で、本人が昨夜のコンサートで着ていたジャケットが話題になっているとしよう。Twitter上では、本人がそのジャケットを購入した店の名前がうわさになっている。このとき、もしあなたがその店の仕入れ担当者だったらどういう行動に出るだろうか。恐らく、ごく短期間だけ大人気になると予想して、コンサートが行われた都市にある店舗にかぎり、そのジャケットを大量に仕入れようと即断するはずだ。

 Twitterにおけるユーザーの動向をモニタリングし、自社のブランドと地理情報、そしてメンション数などの条件を相関分析できる予測分析ツールがなければ、このごく短いビジネス・チャンスは見逃してしまう可能性が高い。

 「これまでは履歴データに基づいて意思決定を下していたが、分析で見つけたトレンドはその時点でもう過去のものになっている。そこで出番となるのが、高速で強力な予測分析というわけだ」(バーンズ氏)

 高速な予測分析が可能になった背景には、オープンソース技術の普及(ビッグデータ・プラットフォームのほとんどはオープンソース技術をベースとしている)、ムーアの法則に基づくプロセッサの進化、ハードウェアのコモディティ化、クラウドの普及、そして以前であれば活用のしかたが分からずに破棄されていた膨大な非トランザクション・データを収集、蓄積できるようになったことが挙げられる。

 ビッグデータの大部分を占めるとされることの多い動画や電子メールなどの非構造化データは、この流れにほとんど関係していない。しかし、ブログ記事やユーザー・フォーラムを巡回し、それらを地理情報と相関分析して、その結果を構造化された顧客データのフラット・ファイルと組み合わせ、さらにFacebookユーザー1,400万人の企業ブランドに関する発言を追跡できるマイクロストラテジーの「Wisdom」のようなツールを利用すれば、それも強力な分析ツールになる。

 マイクロストラテジーの業界マーケティング担当ディレクターを務めるR.K.パレル氏によると、ビッグデータによって2つの変化が起きているという。

 「まず、ソースの異なる幅広いデータが利用されるようになり、さらに、それらを使って細かな改善を行えるようになった。例えば、局面的な意思決定が必要な場合に、iPadやスマートフォンなどのツールを使って判断を変えられるようになったのは、ビッグデータのお陰でもある」(パレル氏)