知財AI活用研究会も第4期にもなり、メンバーの方々のベクトルも色々な方向に向かってきました。メンバーによっては、今年はアジア系の特許のAI判定にチャレンジしたい、あるいは中南米の特許をAI判定したいとの希望もあるようです。


Deskbeeは、その動作原理上から、例えば英語文書を読み込んでAI判定することは可能です。しかし英語に特化したストップワード処理がサポートされているわけではありません。英単語の品詞を正しく判別することもできません。英語文書であっても、「教師特許」に近い案件を何となく抽出することはできますが、日本語特許文書における「抽出精度」と比較すると、非常に劣ることは否めません。


そこで我々はDeskbeeにより海外特許をAI判定する際には、JAPIO GPG/FXの機械翻訳(和訳)文を使用することを推奨しています。いくら「人工知能」と呼ばれているとは言え、現在の特許AIは、決して「人間知能」の足元にも及びません。たとえば侵害防止調査にAIを使う際には、AI判定を使って侵害の可能性が高い案件群を抽出し、これらの案件を「人間知能」で査読する作業が必須になります。この「査読」の作業効率を高めるためにも、特許文書翻訳に優れたGPG/FXの機械翻訳を推奨しています。


ところが困ったことに、GPG/FXの情報源は欧州特許庁が運営するDOCDBです。DOCDBとはEspacenetが検索に使用しているデータベースのことです。欧州特許庁は、陸続きの中東や北アフリカ、あるいは目の前の地中海を飛び越えてアメリカ大陸を南下した中南米の諸国は、頑張って特許情報を集めてくれているようですが、アジアにはあまり興味がないようです。インドでの電子化特許情報が一般公開され始めたのが2005年。Espacenetに収録され、2005年~2014年の間に発行されたインド公報はわずか774件というレベルです。いくら機械翻訳が優れたGPG/FXであっても、得られる機械翻訳文はDOCDBの収録に制限されてしまいます。


ある程度の規模で特許が発行されている東南アジア6か国(ASEAN6)において、フィリピン・マレーシア・シンガポールでは特許文書は英語で記載されています。しかしこの国々の特許もGPG/FXからは十分な情報を得ることができません。


この数年、商用特許データベースの新興国収録も進歩し、非常に高い収録率を誇るデータベースも出てきているようです。たとえば米国のIFI Claims社では各国の特許情報を色々なデータベースベンダーに販売しているようです。
 

https://www.ificlaims.com/partners.htm
 

このような「非DOCDB系商用データベース」から英文情報を入手し、これを機械翻訳(和訳)できれば、GPG/FX非収録国であってもDeskbeeでAI判定させることができます。


前置きが長くなりました。次のような実験をやってみました。


・ 約6000件のUS特許をTHE調査力に取り込み、
・ THE調査力の「自動翻訳」機能を使用して機械翻訳し、
     
・ この機械翻訳文(RBMT翻訳文)と
・ GPG/FXから取得した翻訳文(SMT翻訳文)のそれぞれを、
・ DeskbeeでAI判定

させてみました。
 

Deskbeeが「よりSearch特許に近い」と判定した順序で、各案件を査読した時に査読した件数(横軸)と、再現率(縦軸)に描くと次のようになりました。
 

若干、GPG/FXの再現率がTHE調査力の翻訳文再現率を上回っている部分もありますが、SMTであってもRBMTであっても、ほぼ同程度のAI判定結果が得られることがわかりました。

AI判定の後の査読工程では、RBMTの
前側および背側を含む半導体基板を有する光電変換装置は本願明細書において開示される、半導体基板の前側の上に形成される保護層、半導体基板の背側の上に形成される第一非単結晶半導体層、第一非単結晶半導体層の背側の第1部分の上に形成される第一不純物を含む第一導電層および第一不純物および第二不純物を含んでいる2枚目の導電層は第一非単結晶半導体層の背側の第2部分に形をなした。
より、SMTの
【EJ】本願発明は、半導体基板の表面に形成された保護層は、半導体基板の裏面側に形成された第1の非単結晶の半導体層、第1の非単結晶半導体層の裏面側の第1の部分上に形成された第1の不純物を含む第1の導電層と、前面と裏面とを含み、半導体基板を有する光電変換装置である。そして、第1の非単結晶半導体層の裏面側の第2の部分上に形成された第1不純物及び第2の不純物を含む第2の導電層を形成する。
の方が適切な選択であることは否定しませんが、DeskbeeのAI判定にとっては、THE調査力の機械翻訳であっても問題なさそうという結果です。


みなさんがお使いの特許データベースから英語文が取得できる案件であれば、たとえその案件がDOCDBやGPG/FXに収録されていなくても、THE調査力の自動翻訳を利用することで、Deskbeeを使用したAI判定ができますよというご紹介でした。

 

アイ・ピー・ファイン株式会社/知財AI活用研究会アドバイザー
中西 昌弘