【新書】数式を使わないデータマイニング入門 隠れた法則を発見する | 本を片手に街に出よう

【新書】数式を使わないデータマイニング入門 隠れた法則を発見する



岡嶋 裕史
数式を使わないデータマイニング入門 隠れた法則を発見する

 今日は1億3千万の日本国民の大多数、ブロガーの大多数が、おめでとうネタを書いているだろうと思われるが、淡々と書評をしようと思う。

 データマイニングってのは一時期「コレで営業成績は倍増!」みたいに、Web2.0並に眉唾ノリで日本に持ち込まれたために、その後、世の社長たちの「オイ!おまえの薦めたデータなんたらってのは何時になったら成果が出るんだ!」というツッコミの波に飲まれ、下火になった感があった。

 今日、データマイニングが再び脚光を浴びるようになったのは、技術の進歩が、やっとその考え方を実現できるレベルに到達したということなのだ。


 日本のIT業界では特に、新しい理論やテクノロジーが出ると、ワイドショーのように、日本中がそれ一色に染まり、その後思ったほど期待できないことが分かるとバブル崩壊、一気に冷めて、むしろ詐欺扱いを受ける。シン・クライアントしかり、ASP、SOAしかり…

 その理由は、大体において、新しいものはまだ技術的な実現性が乏しい段階で世の中に発表されるため、先物買いのメディアや、一部のアルファギーク達が騒ぎ立て、それが一攫千金を目論む輩にレバレッジをかけられて、加速度的にキーワードバブルが起きるためだ。

 IT業界そのものが、何かワケ分からないケド今度のキーワードはかなり儲かりそう!みたいな山師的な側面を常に持ち合わせていることは否めない。

 このあたりの話は誰かのblogの受け売り。でも実際、現在において便利なサービスとして実現されるものの多くは、過去に一度ならず「これからはコレが来る!」みたいな語られ方をしたが、思ったよりも普及せずに忘れ去られていった技術を使ったものも多い。

 過去の新技術、新理論の歴史を振り返ると、現代のビジネスのヒントが得られるかも!さあニュースアーカイブをあさりに行こう!


 さて本書はAmazonやGoogleといった山師の神様的企業をキャッチコピーにギラつかせる割には、極めてオーソドックスに、データマイニングの考え方、利用シーン、それらの概要を学ぼうという地味なものである。

 数式を使わないと豪語するだけあって、確かに四則演算以上の数式は出てこない。算数のレベルで十分読める。

 が、多少ムリがあって、1つ1つの理論を理解するには、解説事例の詳細さに乏しく、ホントに雰囲気しか分からない。

 後半の監視社会がどーたら、なんていうちょっと思想チックな部分は思い切って削り、データマイニングの手法~回帰分析、決定木、クラスタ分析、自己組織化マップのあたりをもう少し詳細に説明したほうが良いと思う。

 しかし総じて、事例や図解が多く、分かりやすい。
 事例にガンダムやメイド喫茶なんていう単語が使われているのは少々狙いすぎ。


_/_/_/_/_/_/_/_/_/_/
出版社/著者からの内容紹介
 グーグル、アマゾンWeb2.0時代に必須の技術を、本質から理解する

 データマイニングが従来の統計分析と一線を画して語られるのは、取り扱う情報が質と量の両面において異なるからです。(略)
 統計分析は情報が高コストであった時代に確立された学問体系です。それは、できるだけ小さい情報量から、世界の姿を知ろうとする試みだと換言できます。一方で現代は巷に情報があふれかえっています。その差が指し示すのは、分析対象が深度を増すことであり、従来は分析対象にしなかった/できなかった情報も対象にできる、すなわち、対象の幅が拡がることでもあります。このように質的にも量的にも変化した分析対象に対して、異なるアプローチ方法が用意されるのは、必然でもあるでしょう。(「まえがき」より)

内容(「BOOK」データベースより)
 グーグル、アマゾン―Web2.0時代に必須の技術を、本質から理解する。
_/_/_/_/_/_/_/_/_/_/



人気ブログランキングテレビ東京だけはいつも通り冷静でいてほしい!クリック! | 他の記事も読む!