こんにちは!うぱの助です。
1週間が経ち、うぱの助の体調も万全になりました!もう元気です!
今回はしっかり授業を受けることができたので、授業を踏まえてブログを書いていきたいと思います。
今回の講義タイトルは「ラジオと音声技術の未来」です。
授業では先に音声技術を取り扱っていたのでそちらをメインに話していこうと思います。
皆さんは音声技術というと何が思いつきますか?うぱの助は「ボーカロイド」ですね。一番最初に思いついた理由はボカロ音楽が好きというのもありますが、どんどん人間のような抑揚で歌っている楽曲も増えてきて、進化を強く感じるからですね。もちろんボーカロイドだからこその楽曲もあり、そちらでも進化を感じます。上手く説明できないのですが、とても耳に入りやすい声になってきているなと思いますね。だからボカロ音楽にあまり興味がない方も聞くようになってきているのかなと思います。
そしてそんなボーカロイドの誕生が2007年。
かなり前ですよね。そんな時から!?って感じがします。そりゃこんなに技術も進歩するか〜と思いますね。しかしボーカロイドは喋ることが苦手です。昔と比べるとかなり聞きやすくはなりましたが、やはり聞きにくいですね。その上調声は自分でしなければなりませんから、曲を作る方が使うソフトのイメージが抜けません。一般の人が日常生活で使うようなものではないですね。
そんな中、日常的に使えるようなものが登場してしまいました。2021年に「CoeFont」というサービスがリリースされました。事前に声を収録しておき、それを元にAIが喋り方、読み方の癖を学習。そのデータを使い、好きな言葉をその声で喋らせることが可能なサービスとなっています。パッとイメージできない方は一時期よくTwitterで出回っていたひろゆきさんのAI生成動画をイメージしていただければ分かりやすいと思います。と言いますか、その動画を作る「おしゃべりひろゆきメーカー」は同じ株式会社CoeFontさんが作っています。「CoeFont」の派生サービスですね。あの動画の声の部分だけを自動で生成すると思ってください。
想像するとすごい技術ですよね。これなら文字入力だけでお喋りをすることができます。
病気などで声を失った方でも事前に声を取っておけば今後も自分の声で喋ることが可能になります。実際に利用されているようで、声を失った方には無料でこのサービスを提供しているようです。今の技術ではそっくりそのままにはなりませんし、本人の声ではないですが、声をずっと聞くことができるのはとても嬉しいですよね。医療の分野ではもっともっと活用できそうな技術だなと思います。
今は CoeFont以外の企業も参戦し、技術向上のスピードアップが予想されます。
その反面、やはり悪用されてしまうものです。声のAIが無断で生成され、使われてしまっているようです。10月15日には声優業有志の方が「NOMORE無断生成AI」というキャンペーンを始めました。
そうなんです。一番打撃を受けるのは声を商売道具とする声優さんなんですよね。AIで生成した声でアニメの声をあてるというのは現状無理でしょう。しかしアニメで使われる声でなくとも彼らの声はとても価値のあるものです。それが勝手に学習され生成され、そして売られていたわけです。こちらのキャンペーンはこの大きな問題を提起し、現状に警鐘を鳴らす内容となっています。
TwitterやYouTubeでキャンペーンの動画は見ることができます。
この技術は先ほど挙げたように上手く使えばとてもいい技術になります。何事も使い手次第です。どこまで使うのか、棲み分けはどうするのかと議論していくことが重要なのでしょう。もう少ししたらそういったAIに関する法律がたくさん追加されていくのかもしれませんね。
また、自分の歌声を分析してなりたい人の歌声に再合成するマイクが現在開発されているようです。できたら面白いですし、憧れのアーティストの声で!という願いが叶えられますが、こちらも勝手に使われるなどして声優さんと同じ状態にならないことを願います。
これに関しては詐欺に使われないかが心配ですね。歌声だけでなく普段の話している声も再合成され、自然な感じで話せるようになってしまうと、年齢もわからない、性別もわからない、本当はどんな人なのか全くわからないという状態がもっと作られやすくなります。会ってみたら全く違うという詐欺、犯罪が増えてしまうだろうなと考えています。こういう犯罪に対する対抗策を考えないといけないのかもしれません。AI感知AIですかね。未来がどうなるのか期待もあり、不安もあるなと思います。
といったところで今回は締めたいと思います。
今回も読んでくださりありがとうございました。次回もぜひ読みにきてください!