ゴミを入れるな
この本を読みました
「外資系データサイエンティストの知的生産術」
印象的なフレーズがありました
《ゴミを入れれば
ゴミが出てくる》
データサイエンスの世界で
よく使われている言葉だと
《Garbage in, Garbage out!》
原文は英語だということでした
著者によると
いくら膨大な量のデータがあっても
目的の本質を外したデータしかない場合
最新の分析ツールを駆使しても
有用な分析結果は得られない
ということです
まさしくだわ!
ちなみにこの章のタイトルが
『データの9割は使えない』
このタイトルにも納得がいった
というのも
これは喋りでも同じことです
「ゴミを入れればゴミが出てくる」
つまり「出るものは入れるものと同じ」
入れたもの以上や以下のものは出てこない
「入れたものと相応のもの」が出てくる
なのでいかに厳選してインプットするかです
闇雲にインプットするのもいいとは思う
とはいえ使える(出る)ものは限られる
そのデータ(ネタ)を駆使できる範囲は
やはりどうしても限られてしまうものです
この「限られる」というのは
「時」と「場所」を選ぶということ
インプットしたとしても
それをアウトプットできるタイミングがない
だから「9割はボツになる」
これは本当にそう
今までどれだけボツにしたか…
使えないといえよりも「使わない」
ボツになるのは意図的な部分が大半です
言うなれば
ボツになるというより
ボツに「する」と言うほうが
僕の感覚では相応しい気がします
とはいえ
それを恐れていては何も出来ない
つまり「ボツ覚悟」でインプットする
時にはそんな覚悟も必要になるのです
ただし!
インプットの仕方ですよね
良質のデータ(ネタ)を仕入れるなら
やはり自分が良質なものを濾過させる
良質なフィルターを持つことが大切
ゴミを排出しないために必要なことです
このフィルターが「良質」かどうか
それはやはりどれだけの量を濾過したか
時にはゴミを排出してしまうこともある
それも含めてひとつの経験の積み重ねです
つまりインプットアウトプットの回数
入れるだけではいけないし出さないのもダメ
入れたならそれを出すことを繰り返すこと
その回数こそがフィルターの性能に繋がる
つまり
ゴミを入れるなというのもあるけど
「ネタをゴミにするか
宝にするかは自分しだい」
僕は日頃こういうことを痛感しています
逆に「ゴミ」だと思っていたものが
「良質な」フィルターを通ることにより
「宝」に化けることだってありますから
なので
どういうフィルターを携えるか
やはりこれに尽きるな
つまりインアウトを繰り返す
入れたらその分しっかり出す
そのサイクルが大事になります
なんだか…
お通じみたいな話になったな
(でも同じことだな)
(いや、そんなことないか!)
今日も読んでくれてありがとう
ほいじゃまた明日!