話題になっている動画生成AI「Sora」についてまとめます。
動画生成AI「Sora」は、2024年2月15日にOpenAI社が公開したText-To-Videoモデルです。
X:OpenAI 2024.2.16
Introducing Sora, our text-to-video model.
— OpenAI (@OpenAI) February 15, 2024
Sora can create videos of up to 60 seconds featuring highly detailed scenes, complex camera motion, and multiple characters with vibrant emotions. https://t.co/7j2JN27M3W
Prompt: “Beautiful, snowy… pic.twitter.com/ruTEWn87vf
OpenAIは2月16日、シンプルなテキストプロンプトから最長1分の動画を作成できる新しい生成AIモデル「Sora(ソラ)」を発表しました。
↳ https://openai.com/sora#capabilities
複数のキャラクターや特定のタイプの動きに加え、被写体と背景の正確な細部を組み合わせた込み入ったシーンを生成することが可能で、
- テキストプロントからの動画生成のほか画像生成
- 静止画をアニメ化
- 動画編集(SDEdit)
- フレーム補間
- トラッキングショット
- 世界シミュレータ
これらが動画生成AI「Sora」で、できるようになるみたいです。
・OpenAI Introducing Sora — OpenAI’s text-to-video model
動画生成AI「Sora」
「Sora」が生成した動画サンプルの中で、これは凄いなと思ったのがこのシーン。
↳ https://openai.com/sora#capabilities
電車から見える流れる景色から現実のように電車の窓に反射する社内の人々の様子。凄いなと。
安全性
開発チームは、昨年DALL-E 3に実施した安全性テストを活用する予定だ。Soraには送信されるすべてのプロンプトで実行されるフィルターがすでに搭載されており、暴力的、性的、憎悪的な画像や、既知の人物の画像要求をブロックする。さらに、生成された動画のフレームを調べ、オープンAIの安全ポリシーに違反する素材をブロックする別のフィルターも用意されている。
(感想)
超高品質なことに加えて、最長1分の動画を生成でき、これまでの動画生成AIがせいぜい数秒程度の動画しか生成できなかったことを考えると、クオリティも動画の長さも他を圧倒しています。
いやーほんと凄いわ。