Musioの音声認識は音素ベース | 最適性理論(音のストリーム)で英語を覚える

最適性理論(音のストリーム)で英語を覚える

  音声英語、つまり英会話、リスニング、発音に関して音のストリーム・ベースで学習するサイトです。

Musioの音声認識の音声認識システムに関して、フェイスブックに次のような答えをもらいました。

桜井様


弊社では、英語会話エンジンを開発している会社でございまして、ディープラーニング基盤技術は音声認識の部分よりは、会話エンジンに活用しております。(音声認識は他社様のオープンソースをご活用しております。)そのため、大変申し訳ございませんが、音声認識技術の原理に関するお答えが難しいことをご理解いただければ幸いです。
何卒よろしくお願いいたします。
AKA

 

もしこれが事実であれば、英語の発音の判定はできないと思います。グーグルもマイクロソフトも音素ベースでは音声認識ができないので、統計的な認識のシステムにしました。

それではサイトで説明している”発音練習 Musioが発音をチェックしてくれます。あなたの発音を録音して再生したり、ネイティブと比較したりもできます。”と言う説明は事実ではなく、誇大表現です。

 

音素ベースですからディープラーニングをしていると言うのも事実でありません。