音声認識についての世界ろう連盟と国際難聴者連盟の共同声明(5/8)

https://www.jfd.or.jp/trs/arc/448

2019年4月29日にWFD、IFHOHが電話リレーサービスの音声認識システムについて提言しました。

 

自動音声認識(ASR)を利用するアプリケーションやAI技術が進展しているが、新しく出現した領域であり、世界ろう連盟(WFD)と国際難聴者連盟(IFHOH)で記録している自動音声認識(ASR)技術の利用体験と事例はまだ多くない。ろう者・難聴者が参画する研究開発に参画する取り組みを継続して改善する必要がある。

共同声明は、自動音声認識(ASR)が現在の通信方法、例えば電話リレーサービス(TRS)や字幕サービス等を置き換えるものではないことを通知する。

現時点では以下の理由により慎重に検討すべきである。

 

特定の地域における電話機の粗悪な音質、またノイズや不特定多数の話者などの劣悪な環境条件のために、電話サービス用の自動音声認識(ASR)が一貫して良好な認識精度を提供することは困難。

加えて、自動音声認識(ASR)システムに知られていない固有名詞や専門用語など、一部の単語の事前学習は難しく、常にいつでも信頼できる認識を保証することはまだ困難。

質の高い字幕サービスや人間のオペレータを介さずに自動音声認識(ASR)サービスを利用することは、ろう者・難聴者を社会への完全参加から排除することになる。

その重要性、緊急事態を考慮すると、電話リレーサービス(TRS)の十分な信頼性とサービスの質は絶対不可欠である。

ろう者・難聴者に関わる自動音声認識(ASR)技術の適用に関し、その検討にろう・難聴の関係当事者が適切に参画することは必要なことである。

世界ろう連盟(WFD)と国際難聴者連盟(IFHOH)は、ろう者・難聴者を支援するための自動音声認識(ASR)の研究開発を歓迎するが、現段階では、人間のオペレータを自動音声認識(ASR)技術に置き換えるのは時期尚早であり、実用化にはさらなる研究開発が必要である。従って、人間を介した電話リレーサービス(TRS)と字幕を、何より優先することを勧告する。

(サイトより引用)

--

今すぐに完全に置き換えようとするのは非常に困難です。

一方で今の時点でもできることもあるので、当事者に確認しながら進め、見極めていくことも必要であろうと思います。

 

信頼できるシステムであるのが望ましいですが、難聴者本人は社会の中で、聞こえにくいなりに本人が努力して解決しています。

そのために周囲にご迷惑をおかけすることもあるでしょうが、本人が努力する分には、あれこれ言われたくないです。不完全なシステムであっても、使えるかどうか、決定権は本人にあるものと思います。