こんにちは。
今日は私の友人の渡辺さんという人物を紹介します。
ちょっと専門的な話も出てきますが、そういうもんなんだくらいの感じで読んでくれれば結構です。
では、彼のご紹介から。
彼は言語解析のプロであり、いわゆるテキストマイニング技術の専門家です。
日本の大学を卒業後、ヨーロッパの大学で博士号を取るために現在も研究を続けています。
そんな彼との出会いは半年ほど前。
私がヘッジファンドを運用している関係で、友人から紹介を受けました。
というのは、ちょうどその頃、東大の松尾先生がテキストマイニング技術を用いた投資戦略を駆使し、ヘッジファンドを立ち上げるという話が様々なメディアで話題になっていたからです。
松尾先生の戦略は、いわゆるブログ解析で、日本国内で個人投資家が書き込んだ株に関するブログ記事を基に、日経平均先物の上下を予測するというものです。
ここで使われている技術は、おそらくクラスタリング分析でニューラルネットワークの一種であるサポートベクターーマシンなんかじゃないかなと思いますが、いわゆる人工知能のパターン認識の分野のもので、さほど難しいものではありません。
そんな中、
「それくらいならもっと良いものを簡単に作れますよ。」
という彼の言葉を信じ、作らせてみる事にしました。
私たちは松尾先生のブログ解析とは全く違うアプローチをとりました。
すなわち、
日本語で書かれたブログ記事を解析するのではなく、海外で英語で書かれたニュース記事を解析しました。
というのは、テキスト分析ではいわゆる構文基礎解析、単語ごとに区切るという作業をしなければならないのですが、日本語は単語の間にスペースがないため分析が難しく、分析誤差も大きくなります。
それに比べ、英語には単語ごとにスペースがあるため分析が容易で、分析誤差も小さくなります。
また日本のマーケットを牽引しているのは国内の個人投資家ではなく、世界のプロの投資家である事を考えると、ブログではなく彼らが読んでいるWSJやFTを分析した方がパフォーマンスが良くなるのではと予測しました。
その結果、予測通り、ブログ解析よりはるかにパフォーマンスが良い戦略を構築出来ました。
日経平均の上下を高い確度で予測する戦略は、現在私が運用するファンドの戦略の一部になっています。
そんな彼が、暇なときに趣味で作ったものが、
International News Map
というもので、過去24時間以内に世界中で最も読まれたニュース記事を国別に表示するものです。
これはRed GateのサイトのTOPページの「世界のニュース」というバナーから飛べるようになっているので、是非利用してみて下さい。
また、その他に、有価証券報告書のデータをテキストマイニングし、上場企業すべての業績データが見れるように企業検索ページを作りました。
業績の良い会社や給料の高い会社などが、一発でランキング表示できます。
これも普通に帝国データバンクから買うと年間500万円くらいするデータなので、他では絶対に無料で手に入らないものだと思います。
是非、皆さんこちらも就職活動の時にでも使って下さい。
検索しているだけで結構遊べますよ。
その他、Red Gateでは皆さんに役立つ情報をどんどん発信していきたいと思うので、どしどしリクエストして下さいね。
作れるものは作ってみますんで(笑)
東大 Red Gate http://red-gate.jp/ 松本勝
にほんブログ村