実は、これ以外に「誤訳や訳抜け」などをまとめて一覧にしていたものもあったのですが、そこに掲載していた不適切な訳の大半は、現在の版では修正されています。
一方、こうして表に出さなかったものに関しては、現在も(ほぼ)残ったまま。
こちらも全部を把握しているわけではないため、あくまで把握できていた範囲でしか見ていませんが、おそらくは全部をゼロから見直すのが難しいのでしょう。
前回も書いたように、国が作る公定訳である以上、もう少し整えて欲しいとは思います。
ただ、量が量だけに、現実問題として追いつかなかったとしても無理はありません。
これと似たようなことは、国際特許分類だけでなく、たとえばTRADOSをはじめとする翻訳メモリを使った翻訳で生じています。
複数の翻訳者の訳が寄せ集めになる、翻訳会社でのメモリ使用です。
メモリに登録されている訳が不適切であったとしても、何かの機会に指摘をされないかぎり、気付けない(あるいは、整備しきれない)。
もちろん、訳した時点では問題ありにしようと思って訳しているわけではなく、そのときのベストだったのだろうとは思います。
それは、特許庁も同じですね。
複数の翻訳者の訳が寄せ集めになる、翻訳会社でのメモリ使用です。
メモリに登録されている訳が不適切であったとしても、何かの機会に指摘をされないかぎり、気付けない(あるいは、整備しきれない)。
もちろん、訳した時点では問題ありにしようと思って訳しているわけではなく、そのときのベストだったのだろうとは思います。
それは、特許庁も同じですね。
ただ、人間のすることですし、常に100%完璧は有り得ない・・・のも抗いようのない事実でしょう。
そうなったときに考える必要があるのは、「いかに定期点検をするか」だと思うのです。
国際特許分類は、改定に伴って増えた分類項目などの日本語訳を新たに作るときに、全体の整合性を取っているようには見えないのですが、それは翻訳メモリも同じこと。
翻訳者が訳を新たに登録するときに、メモリの中に入っている全部の訳を考慮に入れているわけでは、ないのです。
だからこそ、定期的に、全体を整備する必要があるだろうなと。
新たなデータが登録される頻度と量にもよりますが、たとえば毎月末には必ず全体を見直すとか。
もちろん、それをすべて人間が目視でやっていたら、とても対応しきれません。
ある程度まで自動化できる仕組みが必要で、それを考える上での「テストデータ」として国際特許分類は非常に良いサンプルになります。
最低でも、同じ専門用語に対する訳語と表記は、完全に統一したいですよね。
現行のIPC第8版でも、「バネ」と「ばね」、「ならい装置」と「倣い装置」、「半田」と「ハンダ」と「はんだ」、「マニプレータ」と「マニピュレータ」など表記揺れが多数ありますし、パテントマップガイダンスでは、こうしたものは別々にキーワード検索しないと拾えない状態になっています。
この揺れが改善されるだけでも、ずいぶん使い勝手が変わるようにも思います。
ということで。
現行IPCのデータを使って、翻訳メモリを整備する方法を考えてみようと思っています。
頭の中にはすでにイメージができあがっていますから、あとは実際に作って試すのみです。
そうなったときに考える必要があるのは、「いかに定期点検をするか」だと思うのです。
国際特許分類は、改定に伴って増えた分類項目などの日本語訳を新たに作るときに、全体の整合性を取っているようには見えないのですが、それは翻訳メモリも同じこと。
翻訳者が訳を新たに登録するときに、メモリの中に入っている全部の訳を考慮に入れているわけでは、ないのです。
だからこそ、定期的に、全体を整備する必要があるだろうなと。
新たなデータが登録される頻度と量にもよりますが、たとえば毎月末には必ず全体を見直すとか。
もちろん、それをすべて人間が目視でやっていたら、とても対応しきれません。
ある程度まで自動化できる仕組みが必要で、それを考える上での「テストデータ」として国際特許分類は非常に良いサンプルになります。
最低でも、同じ専門用語に対する訳語と表記は、完全に統一したいですよね。
現行のIPC第8版でも、「バネ」と「ばね」、「ならい装置」と「倣い装置」、「半田」と「ハンダ」と「はんだ」、「マニプレータ」と「マニピュレータ」など表記揺れが多数ありますし、パテントマップガイダンスでは、こうしたものは別々にキーワード検索しないと拾えない状態になっています。
この揺れが改善されるだけでも、ずいぶん使い勝手が変わるようにも思います。
ということで。
現行IPCのデータを使って、翻訳メモリを整備する方法を考えてみようと思っています。
頭の中にはすでにイメージができあがっていますから、あとは実際に作って試すのみです。