bespacaptainのブログ

友達の寝言から音声を作れるか？音声合成AI「Qwen3-TTS」

風邪がなかなか治らず、インストールしっぱなしで触れなかった、音声合成AI「Qwen3-TTS」をようやく少し試してみました

今回使ったのは、ベスパ新年会で私のベットの横で寝ていた、メンバーの「寝言」から作りました

３秒あれば音声合成できるというのでやってみました

結果をここにアップできればいいのですが、さすがにメンバーの声の合成なので断念

ベースが寝言なため声のトーンが安定せず、５回ほど回しましたが毎回違うトーンで作ってきました

その中でも低めのトーンなものが一番そっくりでした

寝言という単語のイントネーションが変でしたが、電話先でこの音声で喋られたら

本人だと思ってしまうかも

ベースの声も１０秒ぐらいあれば音質が安定するそうで、今回使ったのは様々な寝言の６秒でした

結果は「作れるが毎回、声のトーンが変わってしまう」でした

何個か作って、本物にそっくりな物を使う、という感じですね

寝言ではなく、きちんと喋っている音声をベースにしたらどうなるか、また試してみたいと思います

※電話での通話で音声を抜かれ、それをベースに音声合成した声で詐欺電話がかかってくる事例があります、私が知っている限りだと主に中国国内での事例が多いそうですが、日本に入ってくるのも時間も問題でしょう、皆さん気を付けてください