データとの向き合い方
『必ず結婚できる45のルール』 にらさわあきこ
⇒ http://www.ebookoff.co.jp/detail/0010324969
『データマイニング入門』 豊田秀樹
⇒ http://www.ebookoff.co.jp/detail/0010780971
『入門ベイズ統計学』 中妻照雄
⇒ http://www.ebookoff.co.jp/detail/0010474730
先日、大学時代の友人の結婚式に出席するため、大阪に行ってきました。
大学時代はそれほどパッとせず、スピーチ担当の別の友人もエピソードのネタに困るくらいの男だったのですが、それがなんと超美人な気立てのよい、しかも6歳も年下の女性をお嫁さんにしていました!
私は現在、大量のデータから有用な知見を見出すデータマイニングを会社の業務として行っています。
その習性から、大量のサンプルを集めることが大前提となって、結果一人一人との関わりは時間的制約により少なくなり、したがって表層的な規則性を頼りにアプローチをかけていたのではないかという後悔の念に、いまさらながらかられています。
近年、スパムメールのフィルタリングなどで注目を集めているベイズ推定という確率的方法論があります。
事前の分布などを仮定せず、とにかく目の前にあるひとつのサンプルを必死に学習していくその推定法は、ひとりの女性を鬼神のごとく口説き落としたその友人を髣髴させます。
過去の大量のサンプルから導きだされたという事実に依拠することに安住し、今まさに目の前に表れたデータの価値を薄めていないだろうか。
人生でもっとも濃い時間を過ごしているふたりの結婚の門出の席でそんなことを思いながら、いままでのアプローチ法に離婚届を突きつけ、新大阪駅を後にしました。