データがあるかないかは分析の視点次第 | 石田マネジメント事務所

石田マネジメント事務所

技術やものづくりに関する最近の話題と気づき、ちょっとした備忘録を書いています。

ディープラーニング、機械学習がうまくゆくためには、いろいろな課題があるとはよく言われるところ。

 

代表的なのは「データがない」というもので、確かに解析に必要なデータがない というのは事実だと思う。

 

ところで、必要なデータとは何で決まってくるのかというと、間違いなく「分析の視点」。

 

猫の顔とか人間の顔を判定したい なら猫や人間の顔の画像を集めればいいが、今後の売れ筋のオンライン配信コンテンツを把握したい、機械がいつごろ故障するのか予知したい となると話は大きく変わってくる。

 

今後の売れ筋の配信コンテンツをみるのに何を見ればいいのか、機械の故障原因ごとにどんなデータをどのくらい集めればいいのか。

 

ほとんどの場合、このあたりで大きな壁にぶつかる。

 

多変量解析とか主成分分析、需要予測などの統計分析はこれまで数十年かけてそれなりの実績はあるし、動画配信では、視聴者の属性や視聴時間などすでに多くの試みがなされているが、おれらも試行錯誤の連続である。

 

機械故障はまだ物理的要素の支配範囲が大きいが、問題は故障原因がどんな物理量になって表れるのかの全体像を知ることがほとんどできない。

 

分析の視点と方法、データ収集、場合によっては生成?はかなり難しく今後もあまり変化はないだろう。