最近、よく耳にしますね、ビッグデータ。
もはや一般化したこのビッグデータ…
一般的な使われ方、一般的な定義のされ方をして、
もうとっくにウンザリです。
元々はコンビニエンスストアのPOSシステムを介して、
客の購買履歴を大量に収集し、
マルコフモデルや隠れマルコフモデル…は使って無いのかな?
ま、とにかく、意外な傾向を見つけ出し、
その商品を近くに置いたら、やっぱり売れた、
という販売戦略に使われたのが始まり。
古い古い手法です。
この大量のデータはそもそもあったわけで、
少し前なら検索キーワード、
もう少し新しいならツイート、バズ、
とにかくインターネットでクロール出来る大量データはの事を指している様なのです。
混在してはイケナイのは、
データとその応用先が専門である場合と、
このインターネットのデフォルトであるベストエフォートのデータおよびその応用先です。
昨日、天下のNHKでさえ、解説委員が、
『ビッグデータを統計的に利用する』と言いました。
対象が専門的であるにもかかわらず、
ビッグデータさえ使えば、
統計的手法さえ使えば、
さぞ魔法のような素晴らしい解決方法が見つかる、
かのように言っていた事に愕然としました。
ビッグデータにも色々あるけど、どのデータ使うの?
統計手法にも色々あるけど、どの手法使うの?
が全く解説されていません。
それもそのはず、応用先の特性や持って行きたい方向によってしか決まりませんから。
という事は、政治経済に使うとしたら、政治経済学者がコンピュータサイエンスを知っている必要があるし、
コンピュータサイエンティストも、
…
!!!
経済や人口や所得やなどの、
自治体に掴まれる電子データ(候補含む)
って?
それの大量がビッグデータだから…
わー

たぶん、エライ事に気付いた

これ以上は詮索って言われかねないからヤメヨ

こっわー

