ハンズラボCEOの長谷川秀樹が、どうすればエンタープライズ系エンジニアがもっと元気になるのか?と | 億の細道

億の細道

1億円をようやく突破してきました。


果報は寝て待てというけれども、どうですかね?

ハンズラボCEOの長谷川秀樹が、どうすればエンタープライズ系エンジニアがもっと元気になるのか?という悩みの答えを探し、IT業界のさまざまな人と酒を酌み交わしながら語り合う本対談。第11回は、今のビッグデータブームがやってくるずっと以前からデータ分析を主軸とする事業を展開してきた株式会社ブレインパッドの代表取締役 草野隆史さんがゲスト。前編では会社設立の経緯や、データ分析をビジネスの現場で活用する方法や課題について、東急ハンズの事例も交えて語られました。

DSC00038

株式会社ブレインパッド 代表取締役 草野隆史さん
1997年慶應義塾大学大学院政策・メディア研究科修士課程修了。
外資系ITベンダーに入社後、事業企画や法人営業に携わり、マーケティングを学ぶ。
2000年に大学時代の友人とネット系ベンチャーを設立。この際、企業に日々蓄積される膨大なデータを活かしてビジネスができないかと考え、仲間4名と共にブレインパッドを設立。

やがてくるデータ分析時代に先駆けて起業

長谷川ブレインパッドさんは、創業何年目になりますか?

草野12年目です。

長谷川最初は、どういう思いで会社を立ち上げたんですか?

草野私、前職は2000年に友人と起業して、ISP(インターネットサービスプロバイダ)っていう、大きいところだとニフティとか、ああいう感じのサービスのベンチャー版をやっていたんです。無料のISPとしては同時期にやっていたライブドアが広告モデルだったのに対して、私たちはキャリアからのキャッシュバックのようなモデルで…。

長谷川キャリアからのキャッシュバック?

草野当時のインターネット接続は、まだダイヤルアップが中心でした。ダイヤルアップで接続するには、ISPへの接続料とは別に電話代が必要でした。電話代のコストは大雑把に言うと、①エンドのお客様からNTT局舎までの回線費と、②局舎間の回線費と、③NTT局舎からISPまでの回線費の3つに分かれます。そこで、NTTの局舎までこちら側から専用線を引いたら、③の通信費を浮かせられます、という交渉をしたんです。お客様からは、ネット接続料はとらないけれども、ダイヤルアップにかかる電話代は私たちが回収して、先ほどの①と②の分をNTTに支払って差額を利益にする、そんな感じのビジネスモデルだったんです。

長谷川それは素晴らしいビジネスモデルですね。

草野そうなんですけど、2001年に「Yahoo! BB」の提供が始まったので、無料のナローバンドというビジネスは激安のブロードバンドの前に木っ端微塵に壊れちゃったんですよ(笑)

それでも、地方のたくさんのプロバイダにインフラを貸すというビジネスで黒字化までしました。そこで一区切りついたので、「次の何かをやろう」ということで考えて起業したのが、データ分析の会社だったんです。

ユーザーの環境がナローバンドからブロードバンドに変わっていく中で、流通するデータ量が加速度的に増えていくのを、私たちは目の当たりにしてたんです。このスピードでどんどん加速してインターネット上で完結するビジネスが増えていくと、企業にはものすごい量のデータがたまっていくし、これまではリアルで目に見えていたものがデータでしか見えなくなっちゃうので、これは問題だと。私は1社目の会社がサン・マイクロシステムズでソフトウェアベンダーと組んで仕事をしていたので、日本の企業は分析ソフトをなかなか活用できていないだろう、と予想していたんです。

長谷川そうすると、元々ブレインパッド立ち上げる時から、分析に注力したっていうことですよね。

草野そうです。

長谷川どっちかというと、ツール売って儲けるというようなやり方が主力だと思うんですけど、よくぞ自分たちで分析するという領域に…。

草野そうなんですよ。データマイニングという言葉が90年台後半に流行ったので、企業はツールを買ってはみるんですけど、使いこなせなくて手放してしまうという状況だったんです。だから、ツールの普及どうのこうのではなく、ビジネスの課題をどう分析で解くかということのスキルを持った人間がいないことが危機的な状況なんだな、ということがなんとなく分かったんです。

そこは経験を積まないことにはうまくならないので、分析に特化したビジネスを立ちあげれば、経験や人材を集めてきて技術のノウハウがストックできるかなと。2004年では絶対に早いということは分かっていたし、周りからは、分析をやったことがある人ほど「儲かんないしやらないほうがいいよ」とアドバイスをいただいたのですが、いつかはこういう時代がくるはずなので、経験や知識がない分フライング気味で人より早く始めないと、という思いで、始めたわけです。

データ分析が一般化していなかった創業時、実績のつくり方は?

長谷川当時、今でもそうだけど、会社の大事なデータを人に見せるのって、信用力とかそういうのがないと、難しいよね。IBMとかデカイ会社だったらできるかもしれないけど、「ベンチャーにデータを渡すのは…」という反応はなかったの?

DSC00043

草野ありましたね。特に個人情報保護法が施行された直後だったんで、個人情報だろうとそうでなかろうと、データを出すことに関してすごいアレルギーがあったんです。とてもアゲンストな感じでした。

もちろん私たちが「オンサイトで仕事をやります」と、常駐してしまえばそこも解消できたと思うんですけど、現実はそんなに人はいないし、やっぱりノウハウがたまらなくなっちゃうので。現場でたまったノウハウを持ち帰るとしても、一緒に経験してなきゃ意味がなかったり、複数人でやることで効率化するとか、やりながら教育して育てるということができない。だからそこは譲っちゃダメだよねということで、特に初期のころはできるだけ常駐はしないように、するならズルズルいかないように期限が決まってるものだけ、という風にやってました。

ただ、10年前だと、データを出すこと云々以前に、その前にそもそも「データがたまってないから」という人の方が多かったです。

長谷川そのときは、「しめた! これでデータウェアハウスを一式売って儲けちゃおうかな」という風にもいかなかったですか?

草野そこはやっぱり、大量のデータを持っているところって大きな会社さんが多いので、当時は、大手のベンダーさんががっちり入っていてなかなかとれなかったんです。

そんなわけで、もともとデータを持っているところという意味で、最初は金融系のクライアントが多かったです。金融系はオペレーション上、お客様との履歴は全部とっておくじゃないですか。株だったら売り買いの履歴、カードだったら利用履歴とか。だから、「分析用ではなくても、たまってますよね、このDB。それをダンプしてください。それをこういう風に使えばこういうことができるんで」といった話で説得して、理解いただけた方から仕事をもらっていました。

それと、初期の頃は、広告代理店や印刷会社と組むということもありました。バリアブルプリンタといって一人ひとりに刷り分けができる印刷機があるんですが、それを使うには誰に何を刷って送ったらいいかという分析が必要なわけです。印刷会社にはいい印刷機はあるんだけど、分析の部分はノウハウがないのでうちと組んでやるとか。最初はそういうパートナーの信用で、実績を作っていきました。

DSC00048

長谷川分析って、「基礎データ全部投げたらそこから法則性見つけて、そっちで勝手になんか言ってくれるんじゃないの?」みたいな、そういうサービスだと思ってるお客さんがいる気もするんですけど、御社の場合はお客さんとの役割分担とか、どういう風に進めるんですか?

草野創業の割と早い時期に、情報システム部門へのアプローチは難しいと思ったんです。日本の情報システム部門っていわゆる守りのITの人たちも多いので、攻め、つまりビジネスに使えそうな分析をしてもアクションがとれなくて、「へー」で終わっちゃうことも多いんです。なのでビジネス課題を持っているマーケティング部門とか営業部門とか経営企画部門に行って、さらに、単に「分からないことは何ですか?」というよりは、ヒアリングを丁寧にして「この施策を改善するためにこういう分析をしましょう」といった、最初から分析の活用の出口が決まってる仕事から始めていきました。

「DMは何通くらい送ってるんですか」「どういう根拠で送ってるんですか」みたいなことを聞いて、「5%無駄打ちを減らせばこれだけの収益が改善します」といった試算もさせていただいて、「だったらこれくらいのお金を投資していただいても惜しくはないのではないですか」と。分かりやすく効果が出るところからだんだん進めていくということを、最初の頃は特にやってました。

人間の理解を超える結果は現場で使えない?

長谷川分析の対象や手法って、当時と変わってるんですか? 今流行の言葉でいくと、マシンラーニング的な、「機械学習で何かを導き出す」的なところまでいってるのか、「いやいやあれはまだもうちょっと先の話で、今も泥臭くやってますよ」なのか、今どんな感じなんでしょう?

草野DM送付先の分析ひとつとっても、手法はどんどん変わってきていて、機械学習でやることもだいぶ増えてきています。

ただ、結局クライアントの理解が大事で、機械学習って「なんでそうなったか」というプロセスが簡単に説明できないんです。「大量にデータを投入した結果こうなりました」「機械が学習した結果です」という、まさに機械学習なんですよ。だからDMをこの人に送る、この人に送らないという確率が付与された時に「なんで?」と聞かれても途中の経緯を誰も答えられない。それだとなんだか気持ちが悪いと感じる人がいると、結局因果関係を説明しやすい、だけど精度が少し落ちる手法をあえて使うみたいなことは、今でもあったりします。

ただ、単純に精度だけを求めるのであれば、統計的な手法だと、現実的には数十個くらいの変数にしぼりこまなければいけないところ、機械学習だと何十何百何千という種類の変数を投入して処理を回せるものが出てきているので、それらを使って少しでも精度をあげるようなことは一方で行われ始めています。これはクライアントの要件やニーズ、あるいは理解度次第でどの手法使うかを選択している感じです。
DSC00091

長谷川なるほどね。

小売業だと、自動発注という考え方が昔からあるんですね。自動発注を取り入れるかどうかは企業によっても方針が違うんですが、ドラッグストアさんとかは、すごく自動発注が進んでいて、そこでは一般素人が分からない演算子とかが出てくるわけです。過去の売上と在庫の推移をみて、だからこれだけ必要ですよっていう発注数がペロンと出てくる。東急ハンズの場合でいうと、それが問題になりまして。人間の頭では計算できない機械の演算による自動発注にしたときに、店舗の人が「俺の責任じゃねぇ」って言い出したんですね。

自分で発注したり、機械でも単純な四則演算でやっているときは、これは何個くるっていうのが分かるんで、次のセールに向けてはどうするとかのさじ加減ができたけど、演算になると「なんでこうなったのか分かんない、機械がこう言っている」と。だから「欠品しても在庫過多になっても俺の責任じゃない」とね。それで自動発注するにしても人間が理解できる数式を元にしようっていうところに戻したんです。

草野店舗の人たちのコミットが薄れてしまったせいで、売上が落ちたりしたということですか?

長谷川それは、データでロジカルに説明した人はいないんだけど…。
発注方法って小売業の中では宗教論争と同じで、正解がないながらもみんなやり方が違うんですよ。それでまあ、営業トップが変わるとやり方が変わるみたいなね。

草野今後はどうなんですか?

長谷川僕の個人的な意見として言うと、手でやった方が…、というのはウソ、迷信。ちゃんと計算式通りにやれば、絶対に人間の方が劣ると僕は思う。

なぜかと言うと、人間忘れるし、見落としもする。機械はリアルタイムの在庫をずーっと押さえてるけど、人間が毎日閉店後に全部棚を見て発注してますかっていうと、そうじゃないわけですよ。

ただ難しいのは、1日に10個以上出るものはいい。しかしながら、ロングテール商品で1ヶ月に3個位売れる、というのは数式が乗らないんです。仮に在庫が3個あったとして、たまたま2個売れると、数式にもよるけど、機械は「これ売れる!」って4個位発注しちゃうわけ。でもその後は全然売れません、とかね。そういう、上手くハマるものとそうでないものをユーザーがみんなごちゃまぜに考えて、「機械じゃダメだ」になっちゃうんです。

本当は、1日2桁以上売れるものは関数でやって、それ以下のものは人間がよく見ながらとか、何をもって自動化するのかしないのかみたいなところをちゃんと切り分けていければいいんだけど、「じゃあこんな場合はどうするんだ、あんな場合はどうするんだ」って現場で言うじゃないですか。「そんなんだったら、めんどくさいから手でやった方が」っていう風にまた戻っちゃう。

草野同じようなシステムで、私たちはリスティング広告などの運用型広告を最適化するシステムを開発してるんですよ。

長谷川ほう。

草野例えば、予算がトータル100万円で、1000とか2000種類のキーワードを入札するとする。それぞれのキーワードをいくらで入札すると100万という予算を丁度使いきって、その中でもできるだけたくさんのコンバージョンにつなげられるか、というような…。

そのときにまさに今のお話で、やっぱりテールのキーワードは予測が当たりにくいことがあるんです。時々スパイクするし。それでも上手くこなすと、トップとミドルとテールのキーワード別にモデルを作ったり、一定の条件で適用するモデルを変えて、みたいなことをして、人がやるより安定的な効果を出せるようになってます。

日々の変化に人間が気づくのって、一手二手遅れますよね。それが機械だったらもう少し速くできるので。

長谷川確かに、それはぴったり乗る感じありますね。いいですねぇ。それはGoogleのアドワーズとかに使うの?

草野GoogleとYahoo!とトータルで予算100万円とするなら、どう配分するかも自動でやったり、予算配分はGoogleとYahoo!で半々と決まっているなら、その先を自動でやるとか、そんなしくみです。