機械学習に新風、画像以外も拡散モデル 「ICLR」解説 - 日経テックフォーサイト (nikkei.com)

 

「機械学習に新風、画像以外も拡散モデル 「ICLR」解説」(日経テックフォーサイト)がちょっと面白い。

Expert Foresight「AI」 オムロンサイニックエックス 谷合竜典氏

 

「機械学習分野の先端研究の場で、大規模言語モデル(LLM)や拡散モデルが大きなトレンドになっている。2024年5月にオーストリアで開催された同分野における著名な国際会議「ICLR 2024」ではその最新成果が集った。LLMではプロンプト入力に関する研究、拡散モデルでは画像生成にとどまらない多様な用途に向けた研究が注目された。様々な産業に広がる画像認識分野では、Transformerアーキテクチャーを利用する動きが盛んだった。」

 

「LLMに関連する研究で注目されたのが、「In-Context Learning(ICL)」を扱った研究である。ICLとは、米OpenAI(オープンAI)が2020年のNeurIPSで発表した論文で導入した言葉である。事前学習された言語モデルが、テスト時に入力プロンプトを通じて、新たな知識を適応的に学習する振る舞いを指す。ICLは比較的新しい概念であるため、ICLについての理解を深めるための研究成果が注目された。ICLへの理解が進めば、LLMに対する効果的なプロンプト入力方法を見出しやすくなるだろう。」

 

機械学習の著名な国際学会「ICLR 2024」では、LLMと拡散モデルがトレンドだった(出所:ICLR)

 

小松 仁