3秒の音声でカスタム音声ができる「Qwen3-TTS」を使ってみました
風邪がなかなか治らず、インストールしっぱなしで触れなかった、音声合成AI「Qwen3-TTS」をようやく少し試してみました
今回使ったのは、ベスパ新年会で私のベットの横で寝ていた、メンバーの「寝言」から作りました
3秒あれば音声合成できるというのでやってみました
結果をここにアップできればいいのですが、さすがにメンバーの声の合成なので断念
ベースが寝言なため声のトーンが安定せず、5回ほど回しましたが毎回違うトーンで作ってきました
その中でも低めのトーンなものが一番そっくりでした
寝言という単語のイントネーションが変でしたが、電話先でこの音声で喋られたら
本人だと思ってしまうかも
ベースの声も10秒ぐらいあれば音質が安定するそうで、今回使ったのは様々な寝言の6秒でした
結果は「作れるが毎回、声のトーンが変わってしまう」でした
何個か作って、本物にそっくりな物を使う、という感じですね
寝言ではなく、きちんと喋っている音声をベースにしたらどうなるか、また試してみたいと思います
※電話での通話で音声を抜かれ、それをベースに音声合成した声で詐欺電話がかかってくる事例があります、私が知っている限りだと主に中国国内での事例が多いそうですが、日本に入ってくるのも時間も問題でしょう、皆さん気を付けてください
