特許翻訳 A to Z

特許翻訳歴25年、業界改善を目指した情報発信歴22年。
自らの試行錯誤に加え、参加者数のべ1000名を超えるセミナーや講座、年間50名前後の個別相談などを通して得たスキルアップのヒントをお届けします。


テーマ:

グーグルパテントの検索結果には、「実在しない」コンテンツが、相当数で含まれます。

過去のある時期に存在して現在は削除された(アクセスするとPage Not Foundになる)という意味「ではない」ので、「実在しない」という表現は、語弊があるかもしれません。

厳密には、「Googleが自動翻訳したと思われる」コンテンツが、結構な数で混じっている、という意味です。
ネット上に「存在」はしても書き手がいない(=機械翻訳の結果)だと言えば、正確でしょうか。

特許出願を検索できる2種類の仕組み(Google Patent SearchGoogle Patents)のうち、昔から知られている前者で特に顕著ですから、一定以上の頻度で特許を調べている人にとっては、おそらく何をいまさら・・・でしょう。
そのくらい、多いです。

たとえば、hydrofluoride というキーワードを検索すると、検索結果の中に「WO 2011004715 A1 (Method for producing hydrogen fluoride)」が含まれます。
この国際出願の出願人はダイキン工業で、国際公開公報は日本語で公開されています。

 

検索結果には対応の英語版が含まれているわけですが、そこには、下の画像のように「翻訳」である旨が小さく表示されています。

 

さて。
オリジナルのWO2011/004715号には、いくつかのパテントファミリが存在します。
その中には、EP2452918やUS2012107223といった、英語公報も含まれます


これらの「特許庁にファイルされた」英文明細書と、Googleが検索結果に出してきた英文明細書の冒頭を比較した結果が、下の画像です。
 


左が出願された英文、右がGoogleです。灰色の部分が「一致」、赤や青、緑は違う箇所です。
内容が全然、違っているのが一目瞭然ですね。
そしてGoogle訳には、不自然なところが多々あります。

Googleが自動翻訳したと思われる英文明細書にも、「注意してよく見れば」翻訳である旨が表示されてはいます。
ただ、「Google Patent」という公報の横断検索さながらのシステムに、「実在しない」公報が相当な数で混じっているということは、普通、あまり想定しないと思うのです。

特許調査をする人にとっては有り難いサービスなのかもしれませんが、翻訳業界にいる身としては、前々から複雑な思いでした。

そして、これと似たような「自動翻訳」は、通常の検索でも起きています。
たとえば、

  "163731-16-6" アルゴン

という検索をすると、「アルゴン」がどこにも含まれないコンテンツが、相当数でヒットします。



ところが

  "163731-16-6" アルゴン -argon

としてマイナス記号を使って英語の「argon」を意図的に除外すると、ヒットわずか4件になります。



こちらは、コンテンツではなく「検索キーワード」をGoogleが自動翻訳して、英語と日本語の両方をキーワードにした結果が最初の状態だと考えられます。

つい昨日だったか、Google Translateがニューラルネットワークを搭載して、精度が格段に上がったというニュースが流れていました。
たしかに、サンプルを見る限り、以前のGoogle Translateよりかなり訳質が向上しました。

ただ厄介なことに、綺麗に訳せているように見えれば見えるほど、誤りに気づきにくくなります。
今後ますます、翻訳者にとってのGoogle使用は、工夫と注意が必要になるかもしれませんね。

■関連記事 
続・Googleの検索結果と「実在しない」コンテンツ
OCR誤認識の自動翻訳が生み出す影響
Google検索結果に混入する、膨大な「自動英訳」データ
世界のグーグル、いくつある?
 


インデックスへ
 

いいね!した人  |  コメント(0)  |  リブログ(0)

水野麻子さんの読者になろう

ブログの更新情報が受け取れて、アクセスが簡単になります