自動通訳電話 | 最適性理論(音のストリーム)で英語を覚える

最適性理論(音のストリーム)で英語を覚える

  音声英語、つまり英会話、リスニング、発音に関して音のストリーム・ベースで学習するサイトです。

時々、自動通訳電話の話題が新聞やテレビで報道されます。この通訳電話を携帯電話で使おうと言う試みです。自動通訳電話とは音声認識と翻訳と合成音声の技術を連続でつなげたものです。



この中でもっとも技術的に簡単なのが合成音声で既に実用的レベルで使われています。問題は音声認識と翻訳です。しかし、音声認識や翻訳に関してまだ正しいモデルさえなく、十分な能力でありませんから、いい加減に音声認識された原文をいい加減に翻訳されたら、音声合成が実用的とはいえ、自動通訳電話はとても使えるものではありません。



現在、実用的と言っているのは、話者は不特定ですが、内容が制限されたシステムです。例えば航空会社の問い合わせのようなシステムです。このシステムは目的が制限されていますので、質問も答えも事前に準備できるものばかりです。



その範囲であれば音声認識も翻訳もかなり楽になります。このように制限を付けなければとても使えないのです。翻訳だけをとってもどんな文章でも翻訳できる訳でないのですから、制約が必要になります。



こう考えると、不特定話者のフリートークの通訳機は夢のまた夢です。音声認識でさえ人間の同じレベルなるのに、どれ程の年数が必要かも分かっていません。



こう、考えると人間が英語で話すと言う事は現在のスーパー・コンピュータでもできないような、複雑な作業です。それを人間は学習により、できるようになるのです。