AI翻訳が言葉の壁を取り除くまであとどのくらい?

 
 
中国の検索大手・百度が開発したスマート翻訳機が今月21日に日本に上陸した。名古屋の観光スポットから最も便利な交通ルートまで、翻訳機は流暢かつ正確な中国語と日本語の双方向翻訳で人々を驚嘆させた。人工知能(AI)翻訳サービスはハードとソフトウェアを通じて様々な対話シーンを繋ぎ、言葉が通じないという問題を解決しようとしている。なかにはAI翻訳は翻訳者を「抹殺する者」になりうると考える人すらいるほどだが、現実はどうなのだろうか? 

▽現状:翻訳機は多いが、精度の向上が望まれるレベル 

2017年はAIが大躍進した1年と言えるだろう。科学技術のトレンドとして、グーグルやアップルだけでなく、百度やアリババも人工知能の製品を相次いで発表し、スマート業界に勢いよく進出している。なかでも「AI翻訳」はインターネットの大手企業のほとんどが進出したいと考えている分野となっている。 

海外では、マイクロソフトが9種類の言語をリアルタイムで文字テキストに翻訳する「Microsoft Translator」という翻訳アプリを発表した。中国国内では、百度翻訳が全世界の28種類の言語の双方向翻訳と756分野に対応している。テンセントのリアルタイム音声通訳アプリ「翻訳君」は、AIカーネルをドライバとして、音声認識やNMT(ニューラルネットワーク)などの技術を用いて、「同時通訳」機能を実現している。 

AI翻訳が急速な進展を見せているが、オーソドックスな翻訳業界からは認められているとはいいがたい。伝神語聯網絡科技股フン有限公司(フンはにんべんに分)の何恩培董事長は、「翻訳機にしても、アプリにしても、中国語を英語または他の言語に翻訳する場合の精度はまあまあだが、外国人が話す英語やその他言語を中国語に翻訳した場合の精度は低く、実際のコミュニケーションにはほとんど役に立たない」としている。 

▽難点:データ不足で言語の仕組みは不文律 

世界において国際会議や発表会などに用いられる30種類以上の翻訳機は、一部のシーンにおける言葉の交流問題を解決しており、その現状として翻訳機はすでに非常に大きな進歩を遂げたものの、一方で、高いレベルの翻訳が目指すところの「信頼性と老練さ、品の良さ」といった点ではまだまだ大きな隔たりが存在している。 

囲碁界を制覇している人工知能・AlphaGoはなぜ翻訳分野においてはその完璧な力を発揮できていないのかという点について、何氏は、「人工知能の分野において、翻訳機が最も難しい課題の一つだというのは周知の事実。囲碁と異なり、言語にはその背後には多元的な文化や複雑な社会的属性が含まれているので、その仕組みを規則化するのは不可能なことだ」と話す。 

また、AI翻訳が「信頼性と老練さ、品の良さ」という高い要求を満たそうとした場合、話し言葉における二つの難題を克服しなければならない。一つは発言者の発音や切れ目を正しく判断し、しかもごく短時間のうちに「発音の区切り」を判断しなければならない。もう一つは話し言葉特有の文法の乱れや文脈の一貫性の無さ、センテンスの切れ目がはっきりしていないといった問題を解決しなければならない。 

翻訳機がどのようにしてこのような問題を解決するのかという点について、清華大学計算機学部の劉洋副研究員は、「AI翻訳機の難点はいかに機械に人間と同じようにスマートな行動をさせるかという点だ」としている。彼は翻訳機はデータをドライバとしているので、その精度はデータによって決まるとしている。現在、翻訳データの多くは政府機関の書類であり、スポーツやエンターテイメントなどの分野に関するデータがほとんどない。それに加えて、各国の話し言葉にはくだけた表現やネット用語も多用されるので、AI翻訳は膨大な基礎語彙のデータベースのサポートを必要とする。 

▽展望:データでAI翻訳の進展を推進 

近年、ニューラルネットワーク(Neural Machine Translation,NMT)の技術によって、翻訳の応用がさらなる進歩を遂げた。NMTは脳の思考モデルを模倣しており、翻訳者と肩を並べるほどの高水準の翻訳文を作成できるようになっているのと同時に、その誤差を55%〜85%にまで下げている。 

また、言語処理や対話型言語などの技術の進歩は翻訳製品のバージョンアップを加速させ、コンピューター支援翻訳(CAT,Computer Aided Translation)から人工知能インタラクティブ翻訳への転換を促している。 

清華大学計算機学部の教授は、「世界には数千種類の言語がある。大部分の言語同士の間の言語資料が不足している。そのため、言語モジュールの構築など言語資料の翻訳をする必要がある」としている。 

AI翻訳は複合学科であり、数学や言語学、コンピューター科学、神経認識科学など多方面の進展にかかっている。そのため、AI翻訳はより多くの分野と一緒になって、データによる翻訳機の発展を促すべきだ。また、コンピューターに婉曲な言い回しや不規則な話し方を理解させるには、まだかなり長い時間を必要とするだろうとみられている。(編集HQ)

※本記事はニュース提供社の記事です。すべてのコンテンツの著作権は、ニュース提供社に帰属します。

TOEICのプロに聞く“600 点の壁”を越えるには?

 
 
TOEIC600点を超えられると、簡単な日常英会話にはついていけるものの、ビジネス英会話は少し厳しいレベル。日本語と英語が入り混じる職場環境であれば、同僚に助けを借りながらではあっても、英語でコミュニケーションは取れるだろう。仕事で英語を使う人は、超えたいであろうTOEIC600点。この壁を越えるためのアドバイスを早川幸治先生に聞いた。

―― 気をつけるべき落とし穴は?

早川幸治先生(以下、早川):TOEIC600点を目指す受験者に問われるのは、リスニング・リーディングともに、しっかりとした基礎力があるかどうかです。語彙力もあがってはいるものの、基礎に穴があるため、同じ難易度の問題でも、正解したり間違えたりと不安定要素がつきまといます。

 例えば、選択肢に質問文とは同じ意味でも異なる表現が使われる場合が挙げられます。たとえば、本文ではDo you know where the contract file is?とあるのに対して、正解の選択肢がThe man cannot locate an item.(ある物の場所が特定できない)のように、大きく言い換えられることがあります。本文が理解できていても、選択肢を瞬時に理解できずに間違えることがあります。

―― リスニングでスコアを落とさないためには?

早川:店や駅での会話や、機械の故障のような予定調和な会話であれば、高い正解率を維持できるでしょう。
 
続きは下記URLから
 

【為末大の視点】第11回 グローバル人材

 
最近ではあまり聞かなくなったが、一時期「グローバル人材」という言葉がとてもはやった。実際に多くの産業が海外に出て競争する必要に駆られていく中で自然と出てきたのだろう。スポーツでもちょうど私たちの世代あたりから海外で戦うアスリートが増えた。


 初めて海外に行き始めた頃、東欧の選手と一緒になることが多く、仲良くなると友達とハグをしてほっぺをくっつける別れ方を習った。なるほど海外ではこうやるのかと思って、違う国の人間にそうしたらギョッとされたことがある。当たり前だが国が違えば対応も違う。


 昔は語学力が重要で、それさえあれば海外の人間と十分にやり取りできると思っていた。ところがしばらくして、語学力は当たり前として、それと同じぐらい相手側の文化を理解し、その文脈に乗った形で会話をすることが大事だと気付いた。考えてみれば日本人同士でも、年齢や出身地や職業でコミュニケーションを切り替える。私の感覚では、国籍よりももはや年齢や都市部と地方の差が大きい。またカミングアウトしているかどうかも含め、LGBTなど性的マイノリティーの方とのコミュニケーションもある。


 知識を得ることと、自分をあらゆる局面に慣れさせていくことが大事なのだろう。もちろん自分の意見で主張すべきところは主張すべきだが、無自覚に何でもかんでも話していると、対立点だらけになってしまう。かつては、欧米人は自分の主張ばかりしているのかと思っていたが、実際にはやはり切り替えをしている。


 異文化のコミュニケーションに慣れている人は、どの辺りが対立点かをよく自覚しながら会話をしている。同じ人間の中に国籍、人種、宗教、性別、年齢など様々な面がある。それを察しながら、円滑に話すにはやはり背景に知識が必要なのだろう。


グローバル人材というと、どうしても国籍をイメージしてしまうが、おそらく今後は、国籍のみならず宗教、性別、年齢などを理解した上でうまくコミュニケーションを取ることが重要視されると思う。国籍を意識し過ぎて、あの人は日本人だからとステレオタイプにはめ込んでしまうようなコミュニケーションはむしろ敬遠される。結局は目の前の人を一生懸命理解しようとする真摯さが重要なのだろう。(元陸上選手)

 

言葉の壁、2020年にも崩壊。総務省とNICTが多言語自動翻訳の実用化目指し「翻訳バンク」開始

 
総務省と情報通信研究機構(NICT)は、音声翻訳とテキスト翻訳の社会実装に向けた取り組みとして、さまざまな分野の翻訳データを集積・活用する「翻訳バンク」を開始しました。

NICTは、音声翻訳アプリ「VoiceTra」、テキスト翻訳システム「TexTra」を通じて翻訳サービスの社会実装に向けた研究開発を行っています。今回の翻訳バンクは、翻訳の高精度化に不可欠ともいえる多岐にわたる翻訳データを総務省とNICTが束ねるといういうものです。当面、100万文 x 100社=1億文のデータ集積を目指す計画。
 
また、翻訳データのライセンス料決める際には、利用する翻訳データを想定したライセンス料を算定します。これにより、コスト負担を軽減できるとしています。

自動翻訳技術の性能向上には、翻訳アルゴリズムの改良に加え、翻訳データの質と量が重要です。NICTでは、翻訳バンクの提供によって質と量を確保するとともに、ライセンス料算定においては、データ提供者とデータを活用する側の好循環モデルを構築したい考えです。

現在、2020年の東京オリンピックに向けたさまざまな取り組みがなされているところです。総務省とNICTでは、オリンピックまでに言葉の壁をなくすのを目標に、音声翻訳技術の多言語&多分野化を推進しています。
 
これを「グローバルコミュニケーション計画」という名前にするのがいかにも行政機関らしいですが、観光面だけでなく、自治体や病院、防災、商業施設などで言葉の壁を取り払う計画です。

なおNICTは、2017年6月に脳の神経回路を模したニューラルネットワークを活用した自動翻訳技術「ニューラル機械翻訳技術」を導入しています。膨大な翻訳データから学習し翻訳すれば、従来よりも高精度な翻訳ができるとしていいます。現在の日英双方向翻訳を皮切りに、中国語、韓国語、タイ語、インドネシア語、ベトナム語、ミャンマー語、スペイン語、フランス語へと拡大していく方針です。
 
 

英語習得が必ずしも万国で歓迎されない理由

 

私が数十年前、欧州駐在ジャーナリストとしてキャリアを開始したとき、フランス語はまさに世界共通語で、民主主義・文化・政治の言語だった。

その地位は現在、英語に取って代わられた。ここで言う「英語」は、英国英語や「アメリカ英語」と呼ばれる変種のことではなく、私が「インターネット英語」と呼ぶものだ。単語や表現が増え続けるこの新たな共通語を使えば、まさに世界中の人とコミュニケーションが取れる。

米経済専門チャンネルCNBCのパリ支局長を務めた5年間、私はフランスの大企業のリーダーの英語が「ぎこちない」から「流ちょう」へ進化するのを目の当たりにした。社会党のフランソワ・ミッテラン政権下で国営化された企業が民営化された時代で、世界のリーダーになることを目指した同国の取り組みの一つが英語力向上だった。

その結果、仏保険大手のアクサは世界最大級の金融サービス企業へと成長し、仏広告大手のプブリシスは通信事業で世界第4位となった。現在、国際的なビジネス界での意思疎通には英語が必要なのだ。
 

続きは下記URLから・・・

https://forbesjapan.com/articles/detail/17698/2/1/1