
おはようございます。和田です。
今日は、音声エージェントサービスについて解説したいと思います。
音声エージェントサービスとは、スマートフォンに話しかけると、その言葉の意図を読み取り、サービスや用意された対応の中から最適な回答を自動回答する仕組みです。
つまり、音声認識によって、電話、メール、スケジュール、アラームなどの機能を使いたいときにスマートフォンに向かって話しかけることで、適切な機能を起動・操作することができるのです。
代表的なサービスとして、Appleの「Siri(シリ)」やドコモの「しゃべってコンシェル」が実用化されつつあります。
以前から音声認識の技術は存在していましたが、その音声認識の精度が悪く実用的ではありませんでした。
ここ数年で、音声認識の精度が飛躍的に向上しているのは、利用者の音声をデータとして保存し、大量の蓄積されたデータを活用しているからです。
つまり、利用者が使えば使うほど、音声認識の精度が上がり、利用者が増えるほどに音声認識の対応範囲(理解できる言葉の種類)が増えるのです。
また、音声認識の技術向上により、騒音が多い場所でも自分が喋った声だけを認識するようになり実用的になりました。。
音声による操作の最大の利点は、利用者のIT技術に対する適応力に関係なく、誰でも簡単に利用ことができる事です。
音声は、究極のユーザーインターフェイスになると言えます。
※ユーザーインタフェースとは、機械、特にコンピューターとその機械の利用者(通常は人間)の間での情報をやりとりするため、コンピュータと周辺機器をつなぐ機能。