発言者名の特定、どこまで可能? | 英語テープ起こしクリプトンのブログ

発言者名の特定、どこまで可能?

あけましておめでとうございます鏡餅。クリプトンは1月4日より営業再開しています。今年もどうぞ宜しくお願いいたします目


早速(!)ですが、今回のテーマはテープ起こしの話者特定について。テープ起こしサービスを提供する上で、書き起こし原稿にスピーチ話者の名前をどれだけ正確に明記することができるか?という疑問は、お客様とクリプトンとの間で起こるミスコミュニケーションの主要な原因のひとつとなっています。


そこで今回は、クリプトンのテープ起こし作業者たちがどのようにして・何を手がかりに、収録スピーチの話者の名前を割り出し特定しているのかを説明したいと思います。


テープ起こし作業者に情報収集スキルがあるとはいえ、録音した講演会やインタビューの場に同席していたわけではないので、完全に情報を把握することは不可能です。このようなテープ起こし作業者の知識の限界を理解して頂くこと、またそれでもできるだけ完結した情報をひとつの原稿にまとめてお届けするためにも、どのような情報がお客様からいただけると助けになるのかを提案することが、今回の目的です。



それでは、テープ起こし作業者が講演会やパネルディスカッション、グループインタビューなどの録音テープを書き起こす際、どのように複数の話者名を特定しているのでしょうか?以下の方法が挙げられます。


(1)お客様から頂く参考資料や、会議のアジェンダ


素材となる録音音声が国際会議やミーティング、シンポジウムなどの中~大規模なイベントの場合、お客様から事前に頂く会議のスケジュール表(アジェンダ)が講演者名の特定に非常に役に立ちます。講演の流れに沿ってアジェンダ順の講演者名を当てはめていくだけなので、これが最も簡単かつ信頼できる話者特定の方法と言えます。イベント素材のテープ起こしをご依頼して頂くお客様にアジェンダ資料の提供をお願いしているのは、それによって作業者が講演者の名前の割り出しにかける時間を省けるだけでなく、講演者についての情報収集を容易にすることができるだめです(参考:参考資料の提供がテープ起こしの質を向上させる )。


(2)ビデオなどの映像メディア


複数の話者が討議しているようなパネルディスカッションなどの素材を書き起こす場合、MP3やWMAなどの音声メディアではなく、話者全員が映し出されている映像データ(WMVやAVIファイルなど)を元に書き起こし作業をすることが話者名の特定を非常に容易にします(音声だけだと、複数の話者の声だけを頼りに話者名を判別することは大変困難です)。


(3)ググる(Googleによる情報検索・収集)


上に上げたような、話者特定のための確実な情報を得ることができなかった場合、話者名の特定は個々のテープ起こし作業者のインターネット情報収集スキルに頼ることになります。書き起こし作業者は、複数に入り乱れる声色から登場人物の人数を特定するところから作業が始まり、それぞれの声色を手がかりにSpeaker1Speaker2といったように発言ひとつひとつの声の主を割り出さなくてはいけません。話者が自分の名前を名乗っている場合は、Googleを頼りにその話者名を検索し、発言者の更なる情報を収集します。もっとも、Google検索でも同一名の別人が検索結果にあがってくることもあるため、発言内容と合致した専門分野・トピックの人物を割り当てるためにも入念に各ソースリンクをチェックします。


この方法で話者名を特定する場合、ネット上で流れている情報が玉石混交で必ずしも信頼できる情報ばかりではないことを念頭に置く必要があります。


(4)声色による話者の特定


(3)でも触れましたが、これは話者特定をする上でもっとも難しい方法といえます。発言者に関する名前・情報が事前にお客様からまったく提供されず、かつ3名以上の登場人物が発言を交わしているような音源を元にテープ起こしを行う場合、声色のみを手がかりに話者名を特定するのはかなりの荒業となります。議論が白熱しており、複数の発言者が同時に声をかぶせて何かをしゃべっているような場合、誰が何を発言しているかを特定しひとつの原稿に全てを書き出すことは非常に困難です。これに加え、テープ起こしの素材となる音源の質が非常に悪かった場合、話者名を特定することはほぼ不可能になります。このような状況下では、テープ起こし作業者はあくまで各々のリスニングスキルに頼ることになり、とにかくベストを尽くすしか方法がありません。誤って発言者と発言内容を取り違えてしまうリスクもあります。


クリプトンではテープ起こしの基本仕様として、話者名を特定せずに[Male] [Female]、もしくはInterviewerIntervieweeという形で話者を記入することを原則としています。逆に言うと、話者名をこれより具体的に割り出すことはあくまでサービスとして行っており、話者特定の手がかりとなる資料が事前に提供されない場合は必ずしも発言者名特定の正確さをお約束できるわけではないということです。これが、お客様とクリプトンとの間で最終成果物への期待値のギャップを生じてしまう点でもあります。※テープ起こしの基本仕様は、こちら に列記しています。


もちろん、完全な情報がいただけなかった場合でもテープ起こし作業者は個々の情報収集スキル・リスニングスキルを駆使してできる限り発言者名を特定できるよう目指していますが、技術的にも限界がありますし、各々の作業者のスキルに依存することになってしまいます。



本トピックの終わりに強調したいのは、できるだけテープ起こしの参考となる資料を事前に提供していただきたいということです。会議のアジェンダファイルや、映像を録画している場合はそのファイル、あるいは話者名をメールにずらっと記入していただくだけでもかまいません。少しでも多くの情報をいただくことで、作業者が情報収集にかける時間をぐっと効率的にし、最終的にはお客さまがテープ起こし原稿をチェックする際の負担を軽減させることができます。


これまでにも何度か別のテーマで「テープ起こし作業には参考となる資料が欠かせない」ことを強調してきましたが、もう聞き飽きてしまったでしょうか(汗)。それでもまだまだ、手元にある資料を快く提供して頂けるお客様が少ないことも事実です。ファイルサイズの重いファイルを、わざわざ時間を割いて送っていただける皆様にはとても感謝しており、なんとしてでもベストクオリティな成果物を届けなくては!と作業者の気持ちを奮い立たせるメラメラ材料ともなっています。ご協力をお願いいたします!


次回は、12月のトップ記事ランキングをお届けします。お楽しみに!