アカデミックな方からの便り

今日はかなり専門的な、東京大学新領域創成科学研究科の研究者からメールをもらました。内容とすれば、音声は音素をベースにしたものでないと言うものです。幼児も親とまったく同じように話さないのはそっくり真似ていないからだと言う論文もありました。

論文の中には数学的に解析すると音声には音素以外に変わらない部分があり、子供はそれを無意識で取り出し、それを真似ているのだと言うのです。これは私のサイトにも書いてある事です。

考えが似ているので、お伺いしたいと言ううれしいニュースでした。もちろん私がサイトで言っていることと、アカデミックな研究の結果が同じということは歓迎すべき事です。

しかし、メールにあったリンクを調べる多くの論文の他に発音学習支援システムの開発がありましたので、さっそくメールで問い合わせました。

音声認識は音素ベースでないことは科学的にも知られていますが、実際にはどうなされているかは科学的に解明されていないはずです。それが分からないで発音学習支援システムを作るのは危険だと思うからです。

私は人間の音声を機械では判断できないし、仮にできたとしても機械を使うべきでないと思っています。

発音を機械で判断するのは、カラオケの点数のようなものです。カラオケの点数が高いと言っても歌が必ずしも上手いわけでなく、プロだから点数が高い訳でもありません。歌が上手いとか下手とかいいますが、どう評価するかは人により違います。

歌にしても上手い下手の判断は永遠に人間の耳で判断すると思います。

英語の発音もやはり人間の耳で聞くしかないと思っています。

最適性理論（音のストリーム）で英語を覚える