最近、動画やショートコンテンツの制作でAI音声を試すことが増えました。台本をすぐ音声にできるので、編集前の確認がかなり楽になります。
ただ、読み上げができれば十分というわけでもなくて、実際には「聞きやすさ」と「コンテンツの雰囲気」が合っているかのほうが大事だと感じています。説明系なら自然で落ち着いた声、キャラクター寄りの内容なら少し表情のある声のほうが使いやすいです。
最近は RoleTTS を試しながら、声の方向性を確認しています。
RoleTTS: https://roletts.com/
最初から完璧な音声を作るより、いくつか試してから用途に合うものを選ぶほうが実用的でした。