最近、生成AIの進歩が凄いですね。
仕事でも生成AIを使って、わからないことを尋ねたり、ソフトウェアのソースコードを書かせたりしています。
ネットなどでもAI画像もよく見かけるようになりました。
しかし音楽や歌となると、まだまだ・・・と感じていました。
去年ぐらいまで、自動作曲はまだ全然使いものになるレベルではなく、画像に比べて技術的に難しいのかと思っていました。
ところが最近、すでに音楽を生成するAIもあると聞いて、半信半疑で試してみました。
早速ですが、AIが作成した音楽がこれです。
私が SunoAI というサイトを利用して、最初に作った(作ってもらった)のがこの歌です。
私は作詞もしておらず、イメージを短い文章で打ち込んだだけ。
イメージは「速いテンポ、シンセサウンド、夜の高速道路、シティポップ」程度の文章。
それを SunoAIが作詞、作曲、編曲、演奏、そして歌まで入れて生成しました。
時間もわずか数分です。
1つのイメージから同じ歌詞で2曲生成され、これはそのうちの1つです。
あまりに完成度が高いので、本当にびっくりしました。
自分で作曲もしていた身としては、心から衝撃を受けました。
音楽を作るためには、メロディだけではなくて、ベースやドラム、バッキングの楽器もすべて自分で考えて演奏または打ち込んでやる必要があります。
慣れている人なら1日でできるかもしれませんが、普通は何日もかけて作るものです。
それだけの作業をたった数分で・・・
しかも稚拙なものではなく、かなりのレベルで。
今回、作詞もAIにやってもらいましたが、作詞は人間で、あとはAIにやってもらう、というのも可能です。作詞を人間がやることでメッセージ性を出して、よりAIっぽくない歌を作ることもできると思います。
また、歌のないインストルメンタルも作れます。
ちょっとしたBGMなら、もう人間が作らなくてもよいかもしれません。
そうなると、それで稼いでいたクリエイターはどうなってしまうのか・・・
話を戻します。
せっかくAIが作ってくれた歌が素晴らしかったので、これをミュージックビデオにしたくなりました。
しかし私は絵が描けないので、今までだったら何か適当な写真をバックに、歌詞を流すだけのものになります。
ここもAIの力を使うことにしました。
何かキャラクターを登場させた方がよいと思い、夜の高速道路に似合うクールな感じの女性キャラクターをいくつか生成してもらいました。

このうち、右下の「オレンジのサングラスをしたショートボブの女の子」を選択。
この子をオープンカーに乗せて走らせる、というイメージで生成してもらうと・・・

た、確かにオープンカーですが・・・
AIにイメージを伝えるのはなかなか難しいですね。
試行錯誤して、ようやくこんな感じの画像が生成されました。

AIは、画像を生成するたびに「似た感じの違うもの」が生成されてしまいます。
ここを厳密に同じにするのはまだ私には難しいので、ある程度のイメージを統一して、ミュージックビデオに使えそうな画像をいくつも生成することにしました。

さて、これらはみな静止画です。
当初は、静止画と歌詞だけで作ろうと思っていました。
今はわかりませんが、昔はゲームのオープニングなども静止画だけで作られているものが多くて、それでも見せ方によってはそれなりに効果的でした。
しかし友人から、静止画を動画にするAIもある、と。
それは少し知っていましたが、まだこれも使い物になるレベルじゃないのでは?と思っていました。
ところがびっくり。
いくつか試すうちに、自然な動画を生成するAIがあることがわかりました。
今回一番多用したのは HailuoAI。
1枚の画像だけで、何の指示もなく6秒の動画を作ってくれます。
もとの静止画の意味をAIが理解して、それがアニメ絵ならアニメ風に、それが人物写真なら人物っぽく動くものが生成されます(それがスゴイ!)。
もちろん当たりハズレはありますが、何度失敗してもまた生成してもらえばよいだけ。
これを使って、静止画を動画にしました。

あとはFilmoraという動画編集ソフトを使い、これらの素材や歌詞を配置して編集していきます。
ここはもう人力のみ。
生成動画をそのまま流すのではなく、軽くズームしながらとか、右に流れるようにとか。ここは個人の趣味やセンスです。

こうして、音楽も絵も動画も全部AIが生成したミュージックビデオが完成しました。
私程度の素人でこんなものができるというのは、少し前なら考えられないことでした。しかしこれが現実になった今、頑張ればアニメも個人制作できるし、すでにやっている方もいます。
「ただ静止画を動かして歌を付けただけ」のものはどんどん価値を失い、よりメッセージ性の強いものが残っていくのでしょうか。
みなさんはどう思われますか?