LaLaVoice chorus - Colorful Days


・そそ、初音ミクが誕生するよりも前に、東芝のlalavoiceは歌える音声合成ソフトだったんでした。テキスト読み上げが本領なんですが、音程を付けるオマケ機能かあった。これを駆使する人たちもいたんだね。

・もとになった東芝音声合成システムは、すでに1990年代末にはあって、Windows95で動作した。とはいえ、雑誌の付録のCDにあったお試し版を使っただけだけれど(後に、製品版のlalavoiceを購入)、かなり太っ腹で、使用制限はなかったと思う。あったとしてもごく部分的なもので、単語ごとにアクセント(有無/位置)・無声化の有無などの辞書編集もできた。

・この手のソフトは、結局、ヒットすることはなかったが、伴奏もつけられる(んですよね?)初音ミクたちが一人勝ちになってしまった。東芝も、たとえば、AKAIかローランドなどと手を組んでいれば、あるいはヒットにつなげられたのかもしれない。あるいは、lalavoiceかヒントになってヤマハがボーカロイドに乗り出したのかもしれない。

・東芝のパソコンには長らくバンドルされていて、それを目当てで2018年にダイナブックを購入したけれど、すでにバンドルは終了。後継ソフトも開発されなかった。音声合成とは逆の手順、つまりこちらの音声をテキストにしてくれる機能が弱かったこともあるのかもしれない。AIを搭載するわけではないので、認識率が低かったのだろう。

・旧世代の音声認識は、もろに音声を認識してテキストに置き換えていた。多少の文法解析はするのだろうが、それを応用してさらに(見かけ上の)音声認識精度を上げる方には振り向けなかったようである。siriにしてもandroidにしてもとても優秀な認識精度を誇るが、文脈を文法解析して、音声データの不備・不良を支援しているに違いない。ぼそぽそしゃべってるのでもちゃんと文字化してくれるので、そう考えてよい。だから、短い言葉だとうまく認識してくれないが、長い発話ほど認識率がよくなったりする。AIにとっては「長い発話」はヒントの宝庫だからだ。