ついにここまで来ましたね。

現在AIが回答をするchatGPTや、AIが絵を描く#Midjourney等など様々なサービスがある。
AIが声を出す、合成音声。この音声がまた1つ進化をした。

合成音声とは

　これは２年前に実用レベルになった絵や回答とは違ってかなり古くからある技術でおよそ20年前には存在していた。当時はデモテープと呼ばれる、歌に歌手が声を入れる前に合成音声でとりあえず歌わせるようなサンプル品だ。
　ある程度の歌声を当てる事でイメージがわきやすいという利点があった。ただし入力が非常に細かいパラメーターを設定しなければならないため膨大な時間が必要だった。

フェイクニュース

　10年ほど前には有名人の過去の映像とともにありえない事を喋るフェイクニュースが流行る。しかし当時の出来栄えは機械の読み上げ機能と変わらないものと本人以外は判別できないレベルの出来ではないかと思うものもあった。

AIキャスト

　最近ではラジオなどで、AIキャストによる読み上げも行われており、違和感を持たない水準でビックリする。5年以内にテレビ局でもAIキャストは使われ始めるのではなかろうか。

合成音声の弱点

　しかし合成音声には弱点がある。従来では入力した文章をしゃべらせる事は出来るのだが、セリフに起こせない、間や息継ぎなどの表現は出来なかった。

改良点

　この弱点をカバーする変革を遂げる。入力が人の音声になるのだ。Aさんがセリフをしゃべると、Bさんの声でしゃべる技術だ。
　この技術はコールセンターなどで利用されるそうだ。カスハラ対策の一環でクレーマーの声がキャラクターの声などに変えられるようになるらしい。この点は非常に評価できる。

技術の悪用

　この技術は悪用できる可能性もある。例えばアニメの声優だ、Aさんが個人で映像作品を作るとする。Aさんだけで複数の登場人物の声をあてる環境が出来てしまうのだ、しかも喋っているデータは数分で十分に複製可能になる。個人製作品なので個人で楽しむ分には問題はない。しかし販売を始めるとちょっと問題がある。著作権の法律を変更しなければならないかもしれない。

著作権とは

　現在の著作権は作った本人が持つ。AIは道具としての立場なので著作権はない。問題は喋っているデータだ。これには著作権は存在する。しかし勉強させることは著作権上問題ないのです。
さて学んだ結果、そこから生成される音声は本物そっくりなのだ。著作権がAさんなのもある程度わかる、しかし、出演もしていない声優の声そっくりとなるとこれは問題になるだろう。

解決方法

　ウマ鹿はこう考える。音声データを有料で販売するか、二次創作扱いにするしかないかと。AIに食わせない法案は無理だと思う。やってはいけないで人類が守れたためしがないからね。