「農業では、AIのデータは量も質も膨大に必要」
日曜朝、久しぶりの「最前線探訪シリーズ」オンラインライブに参加しました。
6回の新シリーズ、初回です。
「AIとロボットによる医薬品開発の最前線」。
AI駆動科学で圧倒的に優れた医薬品分子の設計を、飛躍的に早く、確実なものにするために、独自の技術に取り組む企業のお話を聴きました。
害虫を知るために、4月の"クモに寄生するハチ"の講義から参加し、日清食品(株)の持続可能なエコを念頭に研究中の「代替パーム油」や「動物実験代替法」のお話、「創薬×農薬=創農薬」……などを学ばせていただいてきました。
医薬品も農薬も、新しい薬剤を作りだすのには莫大な開発費が掛かることは知られていますが、
医薬品ひとつに、費用は1500億円。5~10年掛かり、成功率は1/20000と具体化した数値を知ると、開発への時間と費用削減のための「AI」の存在価値に頷けます。
印象的だったのは、データは「質」と「量」が大切ですが、そのデータの質の部分で、同じ実験を同じ人が行っても結果が変わることがあるという「データの質」の問題です。
人の体調や実験の暗黙知を取り除くために、ロボットが役立ち、データの質を高めることができる。なるほど……。
AI予測のデータを、高クォリティで早くを提供することで、治験を早め、好結果に結びつく創薬を目指している進行形のお話が参考になりました。
農業の分野で、試験を繰り返してきましたが、AIをつくる基盤のデータは重要だと、改めて思います。
目的によって変わりますが、基準値が難しく、栽培は「物理性×化学性×生物性」で変化し、肥培管理の影響が大きく、結果は作物の姿が現すもので、非常に複雑です。
収穫物の評価の場合、劣化で調査する数値が変わり、同じ条件下で基準を決めて、相対的に捉えた調査数値になることもあります。
厳密には、調査する部分を表記したデータづくりも必要な場合があり、目的によるデータ採りを意識して調査したこともあります。
話題のchatGPT-2は、GPT-1が「学習」に対して、「質の高いデータ」を集めたものとか。
題材は難しい内容のオンラインライブでしたが……、
日常に情報が氾濫する中で「情報の質」を意識することを単純に学んだ朝でした。
***********************************
ブログ春夏秋冬いつもそよ風
・・・・・・・・・・・・・・・・・・・・・・・・・・・・・
わが家の食育 お家でつくろう!食べよう!
地産地消と特産品を訪ねて
素材を知って食べる かんたんクッキング