3秒の音声でカスタム音声ができる「Qwen3-TTS」を使ってみました

 

 

風邪がなかなか治らず、インストールしっぱなしで触れなかった、音声合成AI「Qwen3-TTS」をようやく少し試してみました

 

 

今回使ったのは、ベスパ新年会で私のベットの横で寝ていた、メンバーの「寝言」から作りました

3秒あれば音声合成できるというのでやってみました

 

結果をここにアップできればいいのですが、さすがにメンバーの声の合成なので断念

ベースが寝言なため声のトーンが安定せず、5回ほど回しましたが毎回違うトーンで作ってきました

その中でも低めのトーンなものが一番そっくりでした

 

寝言という単語のイントネーションが変でしたが、電話先でこの音声で喋られたら

本人だと思ってしまうかも

 

ベースの声も10秒ぐらいあれば音質が安定するそうで、今回使ったのは様々な寝言の6秒でした

結果は「作れるが毎回、声のトーンが変わってしまう」でした

何個か作って、本物にそっくりな物を使う、という感じですね

 

寝言ではなく、きちんと喋っている音声をベースにしたらどうなるか、また試してみたいと思います

 

※電話での通話で音声を抜かれ、それをベースに音声合成した声で詐欺電話がかかってくる事例があります、私が知っている限りだと主に中国国内での事例が多いそうですが、日本に入ってくるのも時間も問題でしょう、皆さん気を付けてください