画像生成AIが驚異の進化 米メタは動画、開かれた新領域」(日本経済新聞 nikkei.com)がちょっと面白い。

 

「『こんな絵を描いて』と言葉を入力すると画家やイラストレーターばりの『作品』を出力する画像生成AI(人工知能)が驚異的な進化を遂げている。9月末には米メタ(旧フェイスブック)が言葉から静止画ではなく動画を生成するAIを発表。イラストレーターの仕事を圧迫するとの懸念がある一方、ビジネス利用を狙った動きが早くも出ている。」

 

「8月、米コロラド州で開催された美術コンテストのデジタルアート部門で、画像生成AIが出力した作品が1位をとった。地元の企業家ジェイソン・アレン氏によるこの作品は、オペラ劇場の舞台を思わせる場所でドレス姿の婦人たちがたたずむ構図。舞台中央の開口部から差し込む光が厳粛な雰囲気を醸し出している。」

 

「アレン氏は人気の画像生成AI『Midjourney(ミッドジャーニー)』を制作に使った。AIにテキストを入力して多数の画像を作成。その中から選んだものを画像処理ソフトで仕上げたという。これが明らかになるとネット上で、AIの『制作能力』への驚きの声が上がる一方、AIを使ったことを『不誠実だ』とする批判も噴出。AIと芸術を巡る議論が巻き起こった。」

 

「画像生成AIへの注目が集まったのはこの半年ほどのことだ。4月にAI研究団体のオープンAIが『DALL-E 2(ダリ・ツー)』、5月に米グーグルが『Imagen(イマジェン)』を発表。8月にかけてMidjourneyや、英新興スタビリティーAIの『Stable Diffusion(ステーブルディフュージョン)』と、毎月のように画像生成AIの新顔が登場した。」

 

「CGを研究する金森由博・筑波大学准教授によると、最近の画像生成AIを成り立たせている技術は主に2つ。1つはきれいな画像を作り出す『拡散モデル』という技術。画像に加えたノイズを除去して元画像を復元する過程を大量のデータで学習する。学習済みモデルはノイズから画像を復元できるようになり、これできれいな画像を生成できる。」

 

「もう1つは、言葉によって視覚的な情報を獲得するための『CLIP(クリップ)』という技術だ。言葉と対応する画像の大量のペアから学習。学習済みモデルは画像が与えられなくても、それを表現する言葉がわかれば、おおよそどんな画像かという情報を獲得できるようになり、画像生成の幅が格段に広がった。」

 

画像生成AI「Midjourney」で制作して美術コンテストで1位をとったジェイソン・アレン氏の作品 © 2022 Jason M Allen

 

画像生成AI「DALL-E 2」による画像=オープンAIのホームページから作成

 

繁戸和幸氏が画像生成AIで作った高層木造建築のイメージ=同氏提供

 

メタAI研究所の動画生成AI「Make-A-Video」で作った動画=同社ホームページから作成

 

画像生成AIが驚異の進化 米メタは動画、開かれた新領域: 日本経済新聞 (nikkei.com)

 

IT起業研究所 代表小松仁