音声認識技術ソフトはどこまでできるか? | 英語テープ起こしクリプトンのブログ

音声認識技術ソフトはどこまでできるか?

今回は、クリプトンの英語テープ起こし作業者の1人が使用している音声認識ソフトについて、どんなものなのかを説明したいと思います。


音声認識技術とは、話された声を言葉として認識し、文字として表示させる技術のことです。英語のスピーチ音声を自動認識し英語のテキストに変換するソフトで最も代表的なのは、Nuance社 が販売するDragon Naturally Speaking(以下、「ドラゴン」)です。クリプトンでは、現在1名の作業者が実際の英語テープ起こし作業にこれを使用しています。今回は音声認識ソフトというものがどのような機能を持っているのか、どのようにテープ起こし作業者に役に立っているのかをご紹介します。



英語テープ起こしクリプトンのブログ 英語テープ起こしクリプトンのブログ
(右)実際に「ドラゴン」を使用している英語テープ起こし作業者


音声認識ソフトは、テープ起こし作業者の中でもPCタイピングが遅い人に役に立ちます。「ドラゴン」は、作業者のPCにインストールすることで専用インターフェースから各種操作を実行することができます。


まずソフトを使用するうえで念頭に起きたいのが、音声を認識させるにもソフト自体へのトレーニングが必要ということです。ソフトをPCに取り込んだ後は、そのPCを使用する全てのユーザー(=個々の声色の持ち主)がそれぞれ個々の「プロフィール」を新規作成する必要があります。これは、様々な声色や話し方のクセに応じてソフト自体が単語・発言の認識を調節しなければならないためです。プロフィールを作成する際には一連のモジュール(トレーニングウィザード)がまず始まり、そこでユーザーは画面に表示されるサンプル文章をマイクに向かって読み上げます。一通り読み上げた後、ソフトが声色や話し方のクセを分析し、実際に書き起こしが必要な音声を認識するための手がかりとします。


ここまでの準備が終わったら、実際に書き起こしが必要な音声を使用しソフトを活用してみましょう。書き起こし作業者は書き起こしが必要な音声をスピーカーで聞き、話されている内容を数秒の時間差でマイクに向かってウィスパリング(=自分の声で再現する)します。ウィスパリングの声をソフトが認識し、PC上にテキスト表示していきます。


このソフトの賢いところは、話されている内容を総括的に把握し、文脈に応じて単語を選んでくれる点です。例えば ‘I scream’ と‘ice cream’を混同したりはしません。


また、英語のボキャブラリに弱いユーザーにとってもこのソフトは大変助けになります。例えば‘habiliments’や ‘sacerdotal’といった、めったに使用しない難解な用語で英語のつづりが分からない場合でも、はっきりと明確に発音を再現しウィスパリングすれば「ドラゴン」は正確なつづりでそれらを書き起こしてくれます。この機能は場所・地域の名前を書き起こす際に役に立ちます。


ユーザーが使えば使うほど、ソフトも声の調子や発音のクセに習熟していき、より正確にテキストを認識するようになります。なので一朝一夕にソフトの精度の良し悪しを判断することはできません。使い慣らしていくことで、場合によっては正しい単語を辞書で探すのに膨大な時間を費やしうる状況下でも、ソフトは的確な単語を選び一発表示してくれるようになるのです。


テープ起こしが必要な音源の中で、医療関連の専門用語を多く含むトピックに出くわすこともあります。この場合でも、「ドラゴン」は文脈を判断し、医療と関連性のある単語・フレーズを表示してくれます。Amebiasis(病名)といった単語も、ユーザーがきちんと発音すればおおむね正確なつづりでテキスト表示をしてくれます。


難解な専門用語でなくても、‘differentiation’のように長ったらしくタイピングが難しい単語を書き起こす場合でも、「ドラゴン」を使えば容易につづりミスなく書き起こしてくれます。クリプトンで実際にテープ起こし作業の際にこのソフトを活用している者からの評価としては、「ドラゴン」はタイピングのスピード・精度の向上に非常に役に立っており、結果としてタイピング以上に情報収集にかける時間を増やすことに成功しています。



テープ起こし作業者の作業補助ツールのひとつとして使用している音声認識ソフト、参考になったでしょうか?なかなか現物をみたことがないとイメージするのが難しいかもしれません。「ソフトを訓練させて精度を上げる」というコンセプトが、今回取材した私には耳に新しい情報でした。


ここでお知らせですが、クリプトンのブログの更新頻度を今後週2回から週1回に変更します。それに応じて、連動するニュースレター手紙のほうも月2回発行から月1回(月間)になります。書きたいことはたくさん、トピックもたくさんあるのですが、マーケティングにかける時間を逼迫する状況になってしまい(叫び汗)今後はゆっくりと、堅実に更新していきます。これに懲りず購読を引き続き宜しくお願いします!!


次回はクリプトンが今月より正式に開始した翻訳サービス目についてご紹介します。