最近、AI技術の進化が凄まじいことになっていますね。特に動画生成AIの発展は目覚ましく、私がAI動画を作り始めた1年前とは比べ物にならないほどクオリティが上がっています。
以前、人間のモデルさんを使ってWeb CMを制作していたのですが、生成AIなら費用を抑えつつ簡単に動画制作ができるのでは?と思い立ち、AI動画の世界に足を踏み入れました。
そしてついに、以前から気になっていたSORAが使えるようになったので、早速試してみました!
今回は、私が最近よく使っているKlingAI、Hailuo AI、Gen-3 Alpha TurboとSORAを比較しながら、AI動画生成の現状についてお話したいと思います。
検証環境と比較対象
今回比較検討したAIツールは以下の4つです:
SORA(OpenAI)- プラス契約での5秒生成
KlingAI
Hailuo AI
Gen-3 Alpha Turbo
それぞれのAIで同様のシーンを生成し、品質、特徴、限界について徹底的に検証しました。
※プロンプトは、ほぼ同じ。ただ、AIによっては長いプロンプトが苦手な場合もあるので短くしたりしている。Hailuo AI以外は画像を作ってから動画にしているが、日本人の生成がGen-3は苦手なので難しい時はKlingAIで作った画像を動かしている。
※プロンプトは、ほぼ同じ。ただ、AIによっては長いプロンプトが苦手な場合もあるので短くしたりしている。Hailuo AI以外は画像を作ってから動画にしているが、日本人の生成がGen-3は苦手なので難しい時はKlingAIで作った画像を動かしている。
1. ソフトクリームを食べるシーン - 繊細な質感表現の勝負
技術的課題
ソフトクリームのシーンは、動画生成AIにとって最も challenging な課題の一つです。以下の3つの要素を自然に表現する必要があるためです:
- クリームの柔らかな質感
- 食べた後の量の減少
- 口周りへの付着
各AIの特徴と性能
- SORA:
- KlingAI:
- Hailuo AI:
- Gen-3 Alpha Turbo:
2. ラーメンを食べるシーン - 文化的背景が影響する面白い結果
KlingAIの卓越性
中国発のKlingAIが特に優れた性能を示したのは、興味深い発見でした。これには以下のような要因が考えられます:
- 豊富な学習データ:中華圏での麺類を食べる映像の多さ
- 文化的理解:箸の使い方や麺の持ち上げ方の自然な表現
- 動きの連続性:麺を啜る際の細かな動作の再現
他のAIとの比較
- SORA:
- Hailuo AI:
- Gen-3 Alpha Turbo:
3. 水中を泳ぐシーン - AIの限界に挑戦
複合的な技術課題
水中シーンが特に困難である理由:
- 物理法則に基づく水の動き
- 泳者の自然な体の動き
- 適切なタイミングでの息継ぎ
- 水中光の屈折や反射
各AIの対応状況
- SORA:
- KlingAI:
- Hailuo AI:
- Gen-3 Alpha Turbo:
実務での活用に向けて
各AIの使い分けのポイント
- 短時間の品質重視シーン:SORA
- アジア人物の表現:KlingAI
- 複雑な動作:Hailuo AI
- 静止画からの動画化:Gen-3 Alpha Turbo
まとめ:動画生成AIの現在地と未来
この1年で動画生成AIは驚異的な進化を遂げました。特に難易度の高いシーンでも、用途に応じて適切なAIを選択することで、実用レベルの品質を得られるようになってきています。
とはいえ、完璧な結果を得るためには、まだまだ試行錯誤と工夫が必要です。各AIの特性を理解し、シーンに応じて使い分けることが、現時点での最適な活用方法と言えるでしょう。
今後も継続的な技術革新が期待される中、制作現場でのワークフローや必要なスキルセットも変化していくことでしょう。クリエイターとして、これらの変化に柔軟に対応しながら、AIツールを効果的に活用していくことが求められます。
今後のアップデートに期待される改善点
- より長時間の高品質な動画生成
- 複雑な物理現象の自然な表現
- 文化的背景を考慮したよりリアルな人物表現
- プロンプトの精度向上
引き続き、最新の動画生成AI技術の動向を追い、実践的な知見を共有していきたいと思います。