発言者名の特定、どこまで可能?
あけましておめでとうございます
。クリプトンは1月4日より営業再開しています。今年もどうぞ宜しくお願いいたします
。
早速(!)ですが、今回のテーマはテープ起こしの話者特定について。テープ起こしサービスを提供する上で、書き起こし原稿にスピーチ話者の名前をどれだけ正確に明記することができるか?という疑問は、お客様とクリプトンとの間で起こるミスコミュニケーションの主要な原因のひとつとなっています。
そこで今回は、クリプトンのテープ起こし作業者たちがどのようにして・何を手がかりに、収録スピーチの話者の名前を割り出し特定しているのかを説明したいと思います。
テープ起こし作業者に情報収集スキルがあるとはいえ、録音した講演会やインタビューの場に同席していたわけではないので、完全に情報を把握することは不可能です。このようなテープ起こし作業者の知識の限界を理解して頂くこと、またそれでもできるだけ完結した情報をひとつの原稿にまとめてお届けするためにも、どのような情報がお客様からいただけると助けになるのかを提案することが、今回の目的です。
それでは、テープ起こし作業者が講演会やパネルディスカッション、グループインタビューなどの録音テープを書き起こす際、どのように複数の話者名を特定しているのでしょうか?以下の方法が挙げられます。
(1)お客様から頂く参考資料や、会議のアジェンダ
素材となる録音音声が国際会議やミーティング、シンポジウムなどの中~大規模なイベントの場合、お客様から事前に頂く会議のスケジュール表(アジェンダ)が講演者名の特定に非常に役に立ちます。講演の流れに沿ってアジェンダ順の講演者名を当てはめていくだけなので、これが最も簡単かつ信頼できる話者特定の方法と言えます。イベント素材のテープ起こしをご依頼して頂くお客様にアジェンダ資料の提供をお願いしているのは、それによって作業者が講演者の名前の割り出しにかける時間を省けるだけでなく、講演者についての情報収集を容易にすることができるだめです(参考:参考資料の提供がテープ起こしの質を向上させる
)。
(2)ビデオなどの映像メディア
複数の話者が討議しているようなパネルディスカッションなどの素材を書き起こす場合、MP3やWMAなどの音声メディアではなく、話者全員が映し出されている映像データ(WMVやAVIファイルなど)を元に書き起こし作業をすることが話者名の特定を非常に容易にします(音声だけだと、複数の話者の声だけを頼りに話者名を判別することは大変困難です)。
(3)ググる(Googleによる情報検索・収集)
上に上げたような、話者特定のための確実な情報を得ることができなかった場合、話者名の特定は個々のテープ起こし作業者のインターネット情報収集スキルに頼ることになります。書き起こし作業者は、複数に入り乱れる声色から登場人物の人数を特定するところから作業が始まり、それぞれの声色を手がかりにSpeaker1やSpeaker2といったように発言ひとつひとつの声の主を割り出さなくてはいけません。話者が自分の名前を名乗っている場合は、Googleを頼りにその話者名を検索し、発言者の更なる情報を収集します。もっとも、Google検索でも同一名の別人が検索結果にあがってくることもあるため、発言内容と合致した専門分野・トピックの人物を割り当てるためにも入念に各ソースリンクをチェックします。
この方法で話者名を特定する場合、ネット上で流れている情報が玉石混交で必ずしも信頼できる情報ばかりではないことを念頭に置く必要があります。
(4)声色による話者の特定
(3)でも触れましたが、これは話者特定をする上でもっとも難しい方法といえます。発言者に関する名前・情報が事前にお客様からまったく提供されず、かつ3名以上の登場人物が発言を交わしているような音源を元にテープ起こしを行う場合、声色のみを手がかりに話者名を特定するのはかなりの荒業となります。議論が白熱しており、複数の発言者が同時に声をかぶせて何かをしゃべっているような場合、誰が何を発言しているかを特定しひとつの原稿に全てを書き出すことは非常に困難です。これに加え、テープ起こしの素材となる音源の質が非常に悪かった場合、話者名を特定することはほぼ不可能になります。このような状況下では、テープ起こし作業者はあくまで各々のリスニングスキルに頼ることになり、とにかくベストを尽くすしか方法がありません。誤って発言者と発言内容を取り違えてしまうリスクもあります。
クリプトンではテープ起こしの基本仕様として、話者名を特定せずに[Male] [Female]、もしくはInterviewer とIntervieweeという形で話者を記入することを原則としています。逆に言うと、話者名をこれより具体的に割り出すことはあくまでサービスとして行っており、話者特定の手がかりとなる資料が事前に提供されない場合は必ずしも発言者名特定の正確さをお約束できるわけではないということです。これが、お客様とクリプトンとの間で最終成果物への期待値のギャップを生じてしまう点でもあります。※テープ起こしの基本仕様は、こちら
に列記しています。
もちろん、完全な情報がいただけなかった場合でもテープ起こし作業者は個々の情報収集スキル・リスニングスキルを駆使してできる限り発言者名を特定できるよう目指していますが、技術的にも限界がありますし、各々の作業者のスキルに依存することになってしまいます。
本トピックの終わりに強調したいのは、できるだけテープ起こしの参考となる資料を事前に提供していただきたいということです。会議のアジェンダファイルや、映像を録画している場合はそのファイル、あるいは話者名をメールにずらっと記入していただくだけでもかまいません。少しでも多くの情報をいただくことで、作業者が情報収集にかける時間をぐっと効率的にし、最終的にはお客さまがテープ起こし原稿をチェックする際の負担を軽減させることができます。
これまでにも何度か別のテーマで「テープ起こし作業には参考となる資料が欠かせない」ことを強調してきましたが、もう聞き飽きてしまったでしょうか(汗)。それでもまだまだ、手元にある資料を快く提供して頂けるお客様が少ないことも事実です。ファイルサイズの重いファイルを、わざわざ時間を割いて送っていただける皆様にはとても感謝しており、なんとしてでもベストクオリティな成果物を届けなくては!と作業者の気持ちを奮い立たせる
材料ともなっています。ご協力をお願いいたします!
次回は、12月のトップ記事ランキングをお届けします。お楽しみに!
ITA Conference(インド翻訳者連盟国際会議)参加レポート
クリプトンの安田・マジッドは、12月16~19日にかけてインド・ニューデリーで開催された第二回インド翻訳者連盟国際会議(ITA International Conference )に、出席してきました。今回のブログでは会議の様子を報告いたします。
会議のテーマは、“Role of translation in nation building, nationalism and supra-nationalism”。多言語国家インドにおいて、翻訳研究界および翻訳産業が国家建設に果たすべき役割を模索することが主要なテーマでした。130名の講演者によるプレゼンテーションが4日間の日程にて行われ、その大半がインド他海外の研究者によるアカデミックな内容のものでしたが、中には多国籍企業にてローカライゼーション・翻訳業務に携わっている講演者のケーススタディといったような、クリプトンにとっても興味深い内容のプレゼンもありました。
クリプトンは英語テープ起こしを主要サービスとしていますが、今後は翻訳サービス(日英・英日翻訳)もどんどん拡大していく予定です。今回インド翻訳者連盟の会議に出席した目的も、インドを拠点としてグローバルに翻訳ビジネスを展開しているインド企業を発掘し、現状と課題や参考となるロールモデルを勉強することでした。
ちなみにインドからグローバル市場に翻訳ビジネスを展開、と書きましたが、インドでフリーランス翻訳者を探そうとしているわけではありません。よく知られているように、日本語は世界で最も読み書きが難しい言語のひとつといわれており、韓国人や中国人ならいざ知らず、それ以外のまったく異なる言語圏に属するネイティブにとってはこれを習得するのは並大抵のことではありません。中には、ITアウトソーシングのように低コストという理由でインドを作業ベースにできるのではないか、と考えていらっしゃる日本人のかたもいるかもしれませんが、インドにおける翻訳産業自体の未成熟さと日本語習得の難しさ(ここムンバイのような大都市においても、日本に関するあらゆる情報へのアクセスがあまりに少ない)、そしてインドにおける「翻訳」という専門職業としての認識の希薄さなどがネックとなっており、インド人の日本語翻訳者を開拓していくという展望は現実的ではありません。このことを再確認する形で納得できたのも、本会議に出席していた講演者や出席者と談話を通してでした。そのためクリプトンの場合は、日本在住の翻訳者または米国・英国などの主に英語圏を拠点とする英語ネイティブの翻訳者を抱えており、翻訳受発注のコーディネーションプロセスを弊社インド本社の日本人・インド人スタッフが行います。
本題から外れてしまいましたが、今回の会議で新たに発見した点を3点、以下のようにまとめました。
(1)インド翻訳産業の現状
インドにおいて、翻訳産業はまず産業カテゴリのひとつとしてまだ認識されていないのが現状です。インド固有の言語(政府が公認している指定言語だけで、22あります)と英語間の翻訳はさておき、国際言語(日本語、ドイツ語、フランス語など)を意欲的に学ぼうとするインド人は、経済的にも時間的にも余裕のある上・中産階級でグローバル企業での就業経験があるような一部の層に限定されています。インド固有言語と英語間の翻訳に至っては、インドでは都市部を中心に英語バイリンガルであることがあまりにも一般的なため(文法的な精度は別として)、専門的なスキルのひとつとしては見られていないのが現状です。
日本語教育に限って言えば、デリーやプネのように日本語教育のハブとして知られている一部都市を除いては、日本語教育が受けられる機関はほどんどありません。生活上も日本文化(アニメ、食べ物、音楽など)に接する機会がほとんどないため、日本語教育を受けている学習者にとっても学習環境は必ずしも整備されているとは言いがたい状況です。このような状況下で、実際に翻訳者として作業可能なレベルにまで日本語の読み書き力をつけることは大変困難です。これは、会場で出会ったインド人日本語翻訳者が口をそろえて言っていました。
また、インドにおいては一般的に、翻訳者養成スクールのようなものも存在しません。体系的に言語教育のノウハウを持って教えているのは、大学などの高等教育機関や政府系機関ぐらいではないでしょうか(もっとも、日本にもあるような英会話スクールは山のようにあります)。
(2)品質基準制定への動き
上のようなインドの翻訳産業の現状を見るとなんとも情けないですが、産業発達の兆しもあります。たとえば、本会議の主催団体であるインド翻訳者連盟
(Indian Translators Association)は現在、翻訳品質基準の制定に向けて4年前から取り組んでいます。翻訳品質基準とは、翻訳業者がクライアントに翻訳成果物を届ける際にある一定の品質水準を満たしているかどうかを客観的に判断するための品質規格です(ISOのような概念です)。たとえばイタリアにおいてはUNI 10574、ドイツにはDIN 2345、オーストリアではÖnorm D 1200のように、政府から公的に承認された品質基準ガイドラインがあります。
このようなドキュメンテーションが明確に存在すれば、インドにいる翻訳者が翻訳をする際にどのようなルールに従って翻訳をしなければならないのかが分かり、ある一定以上の品質水準が保たれます。同時にサービスを利用するクライアントにとっても、「この翻訳会社はこの品質基準認可を受けているから安心して発注できる」といったように、業者を選定する際のものさしとして機能します。
ドキュメンテーションの準備にはさらに数年の時間を要しますが、これが整備されればインドの翻訳業界にとっては大きな布石のひとつとなるでしょう。
(3)インド発グローバル企業のローカライゼーションの成功例
英語のできる豊富な労働力と低コストを強みに、インド企業はどんどんグローバル市場・グローバルサプライチェーンに足を乗り出していますが、そのようななかでコンテンツのローカライゼーションのニーズはますます高まっています。ローカライゼーションには、多かれ少なかれITスキルが必要とされます。インド発グローバル企業としてこれに成功しているのが、日本でもすでにおなじみとなった自動車メーカーのタタ・モーターズ
とその請負業者であるAdayana
です(ゲスト講演者としてプレゼンをしていました)。
中東や東南アジアなど世界のあらゆる国から部品を製造・調達しなければならない今日の自動車業界において、世界各国のタタで働く機械工が同じ作業を同じプロセスで(=プロセスの標準化)行わなければなりません。また、機械工の全てが文字の読み書きができるとは限らないため、プロセスマニュアルは映像と音声を伴ったマルチメディアコンテンツである必要があります。そこで、標準プロセスを整備したうえでそのコンテンツを各国の機械工向けにローカライズ(=プロセスコンテンツのカスタマイズ)するニーズが生まれます。AdayanaはITエンジニアを社内に抱え、翻訳業務自体はフリーランサーに外注し、最終的なソフトパッケージを社内で作る工程でローカライズ業務を請け負うことに成功しています。彼らのすごいところは、翻訳コンテンツのクロスチェックの重要性にインド企業の中でもいち早く気付き、第三者によるプルーフリーディングプロセスを徹底している点です。
ITエンジニアが豊富なことで知られるインドにおいて、このようにITスキルを組み合わせた翻訳・ローカライゼーションビジネスの展望が明るいことはクリプトンにとっても前向きになれる情報でした。
インド・デリー出張を終えて・・・
私(安田)はこの会議のためにデリーを2年以上ぶりに訪れることになりましたが、この間にもデリーが国際都市として非常に発展しているのを散見しました。国際空港が成田空港並みにきれいになっていたこと、空港からのハイウェイもきれいに整備されていたこと、都市中心部のConnaught Placeあたりも随分と美化されていたことなどが挙げられます。商業中心都市とされるムンバイとは大違い(おっと、失言)!と驚きましたが、これもすべて今年10月にデリーで開催されたコモンウェルスゲームズのためだったそうです。東京オリンピックの例と似ていますね。
(左上から)デリー旧市街の様子、インド門の正面、空港
寒さは日本と同じぐらい(?)で、この季節は特に霧が濃いのが特徴です。デリーの食べ物はとても美味しかったです。
今年のブログ更新はこれが最終回となりました。11月にブログを始めて2ヶ月が経過しましたが、いかがでしたか??また来年ここでお会いしましょう(1月5日より再開)!それでは、よい年をお迎えください![]()
![]()
テープ起こしに必要なものは?その2(ソフトウェア前編)
12月10日にお届けした「テープ起こしに必要なものは?その1(ハードウェア) 」に続き、今回は続編としてソフトウェアに注目します(3編構成の2編目)。前回は特にアクセス人気が高かったですが、引き続きテープ起こしエキスパートだからこっそり教えることができる、テープ起こしの作業ツール・知識について語ります!
前回は、テープ起こしをする以前に必要となるもの(パソコン、フットペダル、スピーカーなど)を紹介しました。今回はテープ起こしの実践に必要となるソフトウェアや、作業を楽にするテクニックを紹介します。
(1)音声の録音データ(マイクとレコーダー)
テープ起こしには、なんと言ってもクリアで声が聞き取りやすい良質な録音データが必要不可欠です。それを可能にするマイク・レコーダーには投資を惜しんではいけません。マイクには、設置した周囲の全方位の音をまんべんなく拾う全指向性(無指向性ともいう、Omni-directional)型と、特定の方向からの音声を集中して拾うことができる単一指向性(uni-directional)型の2つのタイプがあります。録音後の書き起こしをする用途には、単独スピーカーが行うスピーチ・ナレーションであれば単一指向性型マイクを、複数の参加者からの発言がある円卓ディスカッションであれば全指向性型のマイクを使用するのがベストです。
(2)録音データの転送用サーバー
テープ起こし業者に作業を依頼する場合、テープ起こしの素材となる録音データを届けるためのサーバー転送が必要となります。クリプトンでは過去のブログ でも紹介しましたが、お客さまのデータ提出用として利用しているのは、ShareFile 社のHTTPサーバーです(クリプトン専用アカウントを開設しています)。もちろんクリプトンのお客様が利用する場合は、会員登録などは不要・無料でご利用いただけます。昔はクリプトンではFTPサーバーを利用していましたが、スピード・セキュリティの面でもFTPにひけをとらず、かつ操作方法が簡単でソフトウェアなどインストール不要のHTTPサーバーを採用しました。大きなファイルになると、インターネット回線のスピードとサーバーの帯域設定によって転送スピードが左右されます。
(3)音声・映像データの編集ソフト
具体的にいうと、以下の3点が挙げられます。
a. データフォーマットの変換ソフト
今日では、たくさんの音声・映像ファイルフォーマットが巷に出ています。特によく知られているのはMP3, MP4, MP2, wav, wmaなどです。もし、録音したデータのファイル形式がテープ起こし作業をするパソコン上で再生できないものだった場合、データをいったん再生可能な別のフォーマットに変換する必要があります。たとえばSwitch、Wavepad、OJO soft、GoldWaveというフォーマット変換ソフトは、あらゆるフォーマットのデジタルファイルをMP3やWAVに変換することができます。
※MP3・WAVは、最も汎用性のあるフォーマットです。
b. 音声データ抽出ソフト
テープ起こしの素材となる元データが映像でサイズが非常に大きい場合、データを軽くするために映像から音声データのみを抜き出すことができます。クリプトンでは、映像フォーマットを音声フォーマットに書き換えるOJOsoftを頻繁に使用しています。これにより、頻繁な一時停止や巻き戻しを伴う書き起こし作業でもいちいちフリーズすることなく、スムーズに作業することができます。もちろん、映像データにある情報にも目を配るため、お客様に原稿を納品する前には必ず映像のほうにも目を通します。
c. バックグラウンドノイズ除去ソフト
すでに上に述べたような音声編集ソフトには、バックグラウンドノイズを軽減する機能が含まれているのが一般的ですが、クリプトンの経験からいうと、これらの自動軽減機能を使用するよりもマニュアル作業でノイズ除去のできるソフトを使用するのが最も効果があります。クリプトンではAudacityというソフトを使用していますが、あまりにもノイズがひどい場合はこれらのソフトが必ずしも機能するわけではありません。
注意:ノイズ除去ソフトを使用すると、オリジナルの音声が一部失われる場合があります。これらを使いこなすのにも、ある一定期間の訓練が必要になります。
(豆知識)イコライザの活用
どのパソコンにも必ず搭載されているマザーボードのサウンド設定機能に、イコライザがあります(厳密にはソフトウェアではありません)。イコライザは、音量を拡張する、バックグラウンドの音声を極力最小化する、などの音声に関わるあらゆる操作を可能とする、非常に有用な機能です。イコライザの中でもBassモードを選択すると、スピーチ音量を拡張することができます。Trebleモードはバックグラウンドノイズを除去し、メインスピーカーの声をクリアにすることができます。音質を落とすことなく音声データを取り扱うことができるため、クリプトンではイコライザの活用が非常に重要な慣行のひとつとなっています。巷に出回っているパソコンにはサウンド設定機能は必ず搭載されているはずなので、テープ起こし作業をする人全員に使ってもらいたい機能といえるでしょう。
↑Equilizerの画面。マザーボードのメーカーによってインターフェースは異なります。
スピーカーアンプ(前編でも触れました)とサウンド設定機能を併せて使いこなすことで、ヘッドホンにくる音質を最大限向上させることができます。
今回のシリーズは前編・後編の2本立てで完結する予定でしたが、実は本記事を執筆しているテープ起こし作業者が「ソフトウェアについて書くことが多すぎて、2回分にまとめられない!」といってきました。そこで、第3回目(1月末の更新となります)に続きます!!
三部作の最終編では、書き起こし作業をしていて必要な調べ物をするための辞書ツールや、各種再生ソフト、その他のテクニックを教えます。
来週のブログは、マーケティングの安田がインド・デリーにて参加したITA conference (インド翻訳連盟のアニュアルカンファレンス)報告をお届けします。今年最後の記事となります。
よろしく!



