インド知財庁ではInPASSと称する特許検索データベースを運営しています。ほとんどの新興国ではデータベース上で開示される情報が要約どまりであり、請求項も詳細な説明も開示されていません。このような諸国では、特許の権利範囲を確定させるためには、現地事務所に依頼して知財庁で包袋を閲覧する等の面倒な手続きが必要になります。オンラインでどんな情報でも取得できると思われる現代社会において、ひと昔・ふた昔まえの時代の話のように思えます。


しかし、さすが「IT先進国」とも呼ばれるインドは違います。前記のデータベースInPASSでは、収録されたほぼすべての案件について、請求項も詳細な説明もオンラインで検索することも可能、もちろん査読することも可能です。インドの場合は特許文献が英語で記されているので、多くの日本人も直接読むことができますが、データベースで開示されるテキスト情報が画像情報ではなく電子テキスト情報であり、Google翻訳等で機械和訳させて査読の効率を上げることも可能です。

ところがやはりインドはインドです。全面的に信頼していると、大きなどんでん返しが・・・。

インド特許調査についての私のセミナーでは以前よりご紹介しているように、InPASSのIPC検索には大きな問題があります。たとえば出願番号201621043245の案件には、図のように3個のIPCが付与されています。

 

このような案件は、複数のIPCを区切るカンマや半角スペースを含んで、書誌画面の表示と完全に同じ文字列を検索しないとヒットしません。個々のIPCのそれぞれを検索してもヒットせず。区切り記号をカンマだけにしても、半角スペースだけに変更してもヒットしなくなります。いろいろな文字列を検索してみた結果を表にまとめました。表の△は半角スペースを表しています。

 


特許を検索したことがある人が作ったデータベースとは思えない動作です。

最近になって私も気がつきました。この酷いIPC検索がさらに「進化」してしまったようです。2021/07/12時点では、「G06K17/00,△G07G1/12,△G07F7/02」を検索しても、この案件をヒットさせられません。今や、複数のIPCが付与された案件はIPC検索することができないという、どこの新興国よりも調査性能が劣るデータベースになってしまったようです。

ところでこの1~2年に公開された案件では、IPC文字列がA61K0033380000の形式で表記されることが多くなっています。10桁の連続数字の、前4桁がメイングループを、後ろ6桁がサブグループを表しているようです。この形式のIPCが使用された案件では、大多数の案件には5個のIPCコードが付与されています。

 



複数のIPCが付与された案件を検索できないデータベースに、5個もIPCが付与された案件ばかり収録されているということは、「このデータベースはIPCを検索できない特許データベースだ」と言わざるを得ません。

しかたがないので中西は、InPASSに収録された全ての案件の書誌情報を参照して、各案件に付与されたIPCを洗い出し、IPC検索が可能なデータベースを構築しました。勘弁してもらいたいものです。

 

アイ・ピー・ファイン株式会社/アジア特許情報研究会
中西 昌弘

知財講演のお知らせです。

 

株式会社 技術情報協会様主催のセミナー

「AI技術を活用した知財業務の効率化と運用の仕方」がオンラインで開催されます。

 

日時:2021年9月10日(金)10:30〜12:00

料金:1名につき60,500円(消費税込み、資料付) 
  〔1社2名以上同時申込の場合1名につき55,000円(税込)〕

 

このセミナーには、アイ・ピー・ファイン副社長の平尾が登壇します。

 

セミナー詳細については、下記のリンクよりご覧いただけます。

 

LIVE配信セミナー「AIによる知財業務の効率化と 効果的な使い方、運用のポイント」

 

なお、このセミナーへのご参加は「講演者紹介割引き」があります。

お申し込みは講演者、平尾啓までお電話ください。

携帯:090-9884-8953

 

ご興味のある方は是非、ご視聴を。

 

 

この記事は「Voice of Indonesia」というインドネシアの公共ラジオ放送局が運営するサイトで2020年の12月にアナウンスされたものです。以下は記事の抜粋です。

 

・・省略・・
このコラボレーションは、アフリカ大陸から19人のメンバーがいるARIPOが、DGIPによって作成されたシステムを採用するのを支援するためのものでした。ARIPOは、インドネシアが作成したシステムがこれらの国で実施するのに非常に適切であると考えています。
・・省略・・

 

少し話がずれますが、東南アジアではアセアン知財協力作業部会(AWGIPG)により、アセアン地域全体の組織的な知財分野の活動が行われています。このAWGIPCではASEAN PATENTSCOPEというアセアン各国の特許等を収録するデータベースが運営されています。このデータベースもARIPOと同様に、WIPOが開発したIPAS版のエンジンをローカライズしたデータベースです。これを実質的に開発したのがインドネシア知財庁のDGIPです。

DGIPはASEAN PATENTSCOPE開発の経験を活かしてARIPOのデータベースの開発を支援することになったようです。しかしこの記事を読んで、アジア特許情報研究会内部ではARIPOサイトの今後を少々心配していました。

・・・・

 

先日、このブログで「アフリカにもWIPO IPAS版データベースが」と紹介したように、ARIPOにWIPO IPAS版のデータベースがお目見えしました。

 

このデータベースから取得した出願番号AP/P/2018/010441の案件のXMLファイルには、

<classification-ipcr sequence="1">
    <ipc-version-indicator>
        <date>2006.01</date>
    </ipc-version-indicator> 
    <section>G</section> 
    <class>G0/</class> 
    <subclass>R</subclass> 
    <main-group>21</main-group>
    <subgroup>/0</subgroup>
    <symbol-position>R</symbol-position>
    <generating-office>
        <country>ID</country>
    </generating-office>
</classification-ipcr> 

のように、付与されたIPCの情報が記されています。

 

<generating-office><country>ID</country></generating-office>
とあるように、やはりインドネシア(ID)知財庁DGIPによりXMLデータが生成されたようです。

過去のDGIPのシステムでは、色々とIPCに関する問題が発生していました。筆者が受ける印象では、インドネシアの知財庁はあまりIPCについて詳しくないようです・・・。

ご存じのようにIPCは、セクション・クラス・サブクラス・メイングループ・サブグループの「5パーツ」で構成された国際特許分類です。XMLの規定上では、IPCの5パーツそれぞれを前記のようなタグを使用して表現します。今一度XML文字列をご覧ください。

クラスとサブグループが
<class>
G0/</class>
<subgroup>
/0</subgroup>
のように記されています。本来ならばIPCのクラスは2桁の数字、サブグループは2桁以上の数字です。

 

こんな妙ちくりんなXMLデータを作ってしまうと、データベース画面上でも


のようになってしまいます。ARIPO案件の技術分野が全く分からなくなってしまいました。

ちなみにARIPOでは従来から使用されていたデータベースにも、このURLから入ることができます。

この「旧データベース」で同じ出願番号AP/P/2018/010441の案件を表示させるとこのように。


 

こちらで表示されるIPCが「正解」のようです。

 

WIPO IPAS版の「新データベース」の運用が開始されたこのあと「旧データベース」がどのようになっていくのか全く分かっていません。「旧データベース」にも新しい案件が収録されるのかどうかわかりません。「新データベース」のデータの修復を心待ちにするしかありません。

ところでここでは

もちろんモザンビークで発行され、所定のIPCが付与された案件を調べてくれなんていう要請もアイ・ピー・ファインではお受けします。
なんて書いてしまいました。前言撤回します。今はARIPO諸国の案件をIPCで検索することができません。ごめんなさい。データベースがまともになるまでお待ちください。
 

アイ・ピー・ファイン株式会社/アジア特許情報研究会
中西 昌弘

さすが国連機関のWIPOです。アフリカ広域知的財産機関(ARIPO)でもWIPO IPAS版のデータベースが採用されていることを知りました。「ARIPO Regional IP Database」をクリックすると図のようなデータベースが開きます。特許だけでなく意匠・商標も収録されているようです。

 

 

ARIPOとはアフリカの英語圏諸国の広域特許庁、言わば欧州特許庁のようなものです。ESPACENETにはEP特許だけでなく、DE特許・FR特許等、加盟各国で発行された特許が収録されているのと同様に、ボツワナ・ガンビア等、アフリカ大陸のどのあたりに位置するのかも知らない国名が並んでいます。今マスコミを賑わせているウガンダも・・・。

 

正加盟国はボツワナ・ガンビア・ガーナ・ケニア・レソト・マラウイ・モザンビーク・ナミビア・シエラレオネ・ソマリア・スーダン・スワジランド・タンザニア・ウガンダ・ザンビア・ジンバブエ・リベリア・ルワンダの18か国のようであり、収録されていない国もあるようです。

 

いずれどんな案件が収録されているのか、日本企業がどこにどの程度出願しているのかを調べてみたいと思います。

 

もちろんモザンビークで発行され、所定のIPCが付与された案件を調べてくれなんていう要請もアイ・ピー・ファインではお受けします。

 

ちなみにアフリカにはフランス語圏諸国の広域特許庁のアフリカ知的財産機関(OAPI)もあります。OAPIのWEBサイトも探してみたのですが、ここでは特許検索データベースを見つけることができませんでした。

 

アイ・ピー・ファイン株式会社/アジア特許情報研究会
中西 昌弘

今期の知財AI活用研究会メンバーから、Deskbeeは同義語や類似語をどのように扱うのかとの質問をいただきました。Deskbeeは同義語なんて一切気にしてくれません。彼にとっては「二酸化炭素」も「CO2」も「炭酸ガス」も全く別物です。精度の高いAI判定を目指すには、自分で同義語を揃えるための処理が必要になります。今日は、この「同義語辞書」についてご紹介します。

国立研究開発法人科学技術振興機構(JST)では、科学技術用語形態素解析辞書サイトを運営しています。このサイトは所定の利用許諾に基づいて無償で利用することができます。

 

このサイトを開いて、図の赤枠のように入力・選択し、Searchボタンをクリックしてください。

 

図のように発光ダイオードの同義語が7種類表示されました。

 

Deskbeeに判定させる教師特許および被判定特許の名称・要約・請求項文字列内に、表の7種類の単語が存在する場合は、これらをすべて「発光ダイオード」に変換することで、AI判定の精度を高めることができます。

 

上記はデータベースを対話操作する方法をご紹介したものです。ウインドウ上部に表示される「ダウンロード」をクリックしてください。

 

開かれたダウンロード画面から、「mecab_thesaurus.zip」をダウンロードし、このファイルを解凍するとデータベースに収録された情報がCSVファイル形式で現れます。Excelで開いてオートフィルタを設定し、「Base Form」列で「発光ダイオード」を選択するとA列の「Surface form」列に、前記の7種類の同義語が表示されます。

 

この情報を活用することで、Deskbeeに判定させる前に同義語を統一することができます。お試しください。

 

アイ・ピー・ファイン株式会社/知財AI活用研究会アドバイザー
中西 昌弘

 

 

今日は知財AI活用研究会のメンバーのみなさんを対象とした話題を提供します。もちろん第1期から第3期に研究会に参加していたOBの方や、研究会には所属していなくてもDeskbeeをお使いのみなさんにも有益な話題だと思います。

 

今期の研究会メンバーから、「Deskbeeで特許分類を判定させることはできますか?」との質問がありました。そこで検討してみた最新の結果をご紹介します。

あらかじめ人手による読み込みを行い、所定の条件を満たした集合(サーチ集合)と、条件を満たしていない集合(ノイズ集合)に分けられた日本特許群を用意しました。サーチ・ノイズともに、約300件という規模の集合です。申し訳ありませんが、母集団の詳細は明らかにはできませんが、ご容赦を。

この集合を件数が1/4の子集合になるようにランダムに分割して、そのうちのひとつを教師特許群として、残りの3つの集合を被判定特許群として扱いました。K分割交差検証法と呼ばれる検証方法です。「交差検証」の詳細はこの文書をご覧ください。

続いてこの特許群を、DeskbeeでAI判定してみました。最初は名称+要約+請求項の文字列を「使用項目」に指定しました。

得られた判定結果を確率差の高いもの(最もサーチ教師に近いと想定される案件)から降順にソーティングし、所定の境界値より上をサーチ案件、下をノイズ案件とします。ここでは適合率・再現率のF値がピークになるポイントを境界値として扱いました。適合率・再現率・F値については、この文書を参考にしてください。

 

結果をご紹介します。

左のグラフが、縦軸:サーチ確率×横軸:ノイズ確率を表した散布図です。赤のドットがユーザ評価によりサーチ案件だと判定された案件、緑のドットが同じくユーザ評価ノイズ案件を表しています。

 

サーチ確率からノイズ確率を減算した「確率差」による閾値を黒線で示しています。黒線の左上に配置された案件が、DeskbeeがサーチだとAI判定した案件、右下がノイズとAI判定した案件群です。

 

右のグラフは、確率差降順に並べ替えた案件群を、何件査読した時に何パーセントのサーチ特許を読むことができるかを表した再現率飽和カーブです。この例では全621件のうち245件を読むことで91%のサーチ特許を読み終わることになります。

 

この結果を混同行列で表すと次表のようになります。混同行列の詳細はこの文書をご覧ください。前記のように求めた境界値を基準としてDeskbee判定させると、あらかじめユーザが評価したサーチ特許のうち205件がDeskbeeによりサーチと判定されたことを表しています。

 

続いて特許明細書内の文字列を判定するのではなく、各案件に付与された特許分類、ここではIPCをDeskbeeに判定させるとどうなるかをご紹介します。

 

IPCは特許庁や工業所有権協力センター(IPCC)の「有識者」が、人工知能ではなく「人間知能」を駆使して分類したコードです。囲碁や将棋は別として、特許の査読についてはまだまだ人間知能に軍配が上がります。この人間知能が付与した分類を人工知能で解析するという合わせ技にトライしてみました。

 

教師特許と被判定特許とでIPCの表現形式が異なると正しい判定ができなくなるため、IPC文字列の形式は上図の形式に統一しました。

 

Deskbeeで、このIPC列だけを「使用項目」に設定してAI判定させました。名称・要約・請求項の文字列は使用せずに、IPCコードだけの判定です。

 

散布図・再現率飽和カーブは次のようになりました。

 

混同行列を計算してみると次のように、名称・要約・請求項テキストを判定した時と大差ない結果が得られたことがわかります。

 

Deskbeeでは入力された文字列を、まずはmecabを使用して形態素単位に分割します。mecabはあくまでも日本語を解析するためのシステムであり、たとえば「G06F 21/34」のIPCコードを入力すると、次のように分断してしまいます。


G       名詞,一般,*,*,*,*,*
06      名詞,数,*,*,*,*,*
F       名詞,一般,*,*,*,*,*
21      名詞,数,*,*,*,*,*
/       名詞,サ変接続,*,*,*,*,*
34      名詞,数,*,*,*,*,*

 

これでは、せっかく特許庁・IPCCの有識者が「G06F 21/34」と判断したIPCコードが壊されてしまいます。このためDeskbeeで特許分類を判定させるためには、「カプセル化」が必須であるというのが、これまでの研究会での通説でした。しかし「カプセル化」することなく、「生のIPCコード」をそのままAI判定させても、十分な結果が得られているようです。

 

Deskbeeでは形態素に分割されたタームを、1個ずつ使用して教師群との近似性を判定するだけではなく、最大5個までの連続タームの近似性を判定する仕掛けが備わっているようです。さらにターム1個の一致よりも、連続ターム5個の一致の方に重み付けされている様子です。この文書にも記されたように、AIツールを使用していると、このブラックボックスに悩まされます。

 

Deskbeeで特許分類IPCをAI判定させることが可能、このアプローチもそこそこ有効であるというご紹介でした。

 

・・・・

 

ところで、このブログでご紹介した例では適合率・再現率のF値により境界値を設定しました。しかしこれはAI判定の目的によって、ご自分で決めるべき値です。

 

たとえば重要特許を絶対に漏らさないことを狙うときには、散布図上での黒の境界線をより右下に位置させる必要があります。また本来の業務に忙しい研究者・開発者に対して、特許査読に要する時間を削減するために、重要な案件だけに絞りたいときには、境界線を左上に上げるべきでしょう。境界値の設定はApplication Specificであることにご注意を。

 

アイ・ピー・ファイン株式会社/知財AI活用研究会アドバイザー
中西 昌弘

 

 

 

フィリピンのレコードがPATENTSCOPEに1年近く収録されない状況が続いていましたが、最近になって遡及収録された気配を感じました。ところが、こんな状況に陥っているようです・・・。

たとえば出願番号「1/2018/502690」を検索すると、同じ出願番号・同じ発行日の案件が重複してヒットします。



図の下側に表示されたものが、従来より収録されていたレコード。私の記録では2020年1月には収録されていたもの。上側が、今回新たに「追加収録」されたレコードです。PATENTSCOPE表示画面上で、下側レコードの枠内をクリックすると案件の詳細書誌画面が開きますが、上側は何も応答しません。


国連機関のWIPOですよ。新興国データベースのような、こんな初歩的なトラブルは勘弁してほしいですね。

 

アイ・ピー・ファイン株式会社/アジア特許情報研究会
中西 昌弘

テレビ朝日の「ポツンと一軒家」という番組で、何キロも離れた位置のお隣さんについて語っているのを見ました。たしかにお隣との間に誰も住んでいなければ、どれだけ離れていてもお隣さんですね。今回は空路17時間20分、約4,700Km離れた日本のお隣さんのパプアニューギニアについてのご紹介です。

 

 

さすがWIPOはお金持ちです。パプアニューギニアにもIPAS版特許検索サイトが開設されているようです。

 

 

2021/06/07時点の収録件数は
意匠:      77件
特許:    857件
商標:33,599件
のような規模。

外務省サイトによると、液化天然ガスをはじめとする鉱業が同国の最大産業のようです。

 

日本から出願された特許案件をパラパラと開いてみたところ、エネルギー関連会社の出願が目立つようです。色々な国の特許データベースではお馴染みのPANASONICやTOYOTAを検索してもヒットしません。

 

 

時間を作って詳細に調べてみたいと思います。

でも、この国の特許調査なんて、誰もアイ・ピー・ファインに依頼しないでしょうね・・・。


アイ・ピー・ファイン株式会社/アジア特許情報研究会
中西 昌弘

7月1日・2日に「第18回情報プロフェッショナルシンポジウム:INFOPRO2021」が開催されます。このシンポジウムは、情報を司る専門家(インフォプロ)のためのシンポジウムとして2004年から毎年1回開催されています。COVID-19の影響を受けて、昨年度からはオンラインでの開催になっています。
(INFOPROの詳細はここをクリックしてください)

例年のシンポジウムでは、特許情報関連について何題も発表されています。

今年も特許情報関連では
7月1日 午前
① SDI への AI 導入による精査の効率化
② 中国特許翻訳情報の検証
③ 機械学習における AI クラス分類の精度評価
④ 河川の氾濫防⽌技術に関する特許分析研究 

7月1日 午後
⑤ COVID-19 の非特許⽂献と特許分析に関する研究
⑥ ⾃社要素技術を活かせる新規市場を特許分類の共起性を⽤いて可視化する⼿法

の6題の発表が予定されています。

この中で①が、知財AI活用研究会第3期のテーマとして、日本化薬株式会社の奥村さんがDeskbeeを使用して社内SDIの業務の効率化を実現したという発表です。③は知財AI活用研究会のアドバイザーの花王株式会社安藤さんによる発表。この中でもDeskbeeによるAI判定が取り上げられています。

④と⑤が、同じくアドバイザーを務めていらっしゃる桐山先生の発表です。今年のシンポジウムで発表される特許情報関連の半数以上が、知財AI活用研究会と関係しているというご紹介でした。

シンポジウムの概要とプログラムはここからご覧ください。

 

【お申し込み】

「第18回情報プロフェッショナルプログラム」へ申し込む
 

アイ・ピー・ファイン株式会社/知財AI活用研究会アドバイザー
中西 昌弘

 

こんにちは。

 

JETRO主催の「ASEAN知財動向報告会」がオンラインで開催されます。

 

アジア特許情報研究会の中西昌弘(アイ・ピー・ファイン)も登壇しますので、

ご興味のある方は、是非。

 

 

==================================================

                 特許庁委託事業

         「ASEAN知財動向報告会」第2回のご案内

==================================================

 

各位

 

平素より大変お世話になっております。

 

今般ジェトロ知的財産課ではASEANにおける最新の知財動向をご紹介するため、

国内外の有識者の方を講師に迎え、ASEAN知財動向報告会を開催しています。

 

今年度も昨今のコロナウィルスの状況を踏まえ、

下記要領にてライブ配信のオンラインセミナーで開催します。

 

ASEANにおいては国によって知財制度や運用状況が異なるところ、

制度・運用を比較できる各国横断的な情報へのニーズが高くなっています。

 

本セミナーでは、ASEAN横断的な最新情報をご説明することで、

ASEANにおける権利化状況や模倣対策について理解を深めていただくことを目的としています。

 

日本企業の皆様がASEANにおける知財戦略を策定する際の一助となれば幸いです。

 

参加を希望される方は、以下プログラムに記載の参加登録URLをクリックして

ご登録をお願いいたします。

 

≪開 催 概 要≫

■日時:

2021年7月9日(金) 10:00~13:40(09:30 zoom接続可能)―日本時間

 

■主催:特許庁、日本貿易振興機構(JETRO)

■開催方法:zoom オンラインセミナー

■参加費:無料

■プログラム(予定):日本時間

 

10:00-10:40 「ASEANの産業財産権データベース調査」

      「ASEANの産業財産権データベースから得られる統計情報の調査」

       アジア特許情報研究会 伊藤 徹男氏

       アジア特許情報研究会/アイ・ピー・ファイン株式会社 中西 昌弘氏

 

10:40-11:00 「ASEANの法律事務所調査」

       オンダ国際特許事務所 弁理士 金森 晃宏氏

 

11:00-12:00 「ベトナムにおける商標の指定商品・役務の審査に関する制度・運用調査」

       「マレーシアにおける商標制度・運用に係る実態調査」

       Kasame & Associates 弁理士 藤田 雅彦氏

 

13:00-13:40  「ベトナムにおける知的財産に関する下位法令等の調査」

       Tilleke & Gibbins 弁理士 大竹 徳成氏

 

 

※講演タイトル、内容、講師は予告無く変更になることがございます。

また、開催時間は多少前後する可能性がございます。予めご了承ください。

 

※講師への質問はWebセミナー画面より、メッセージとして送信が可能です。

ご質問内容は講師と視聴者に共有されますが、質問者のお顔は画面上には表示されません。

いただいた質問には各講演時間の中で10分~20分程度ご質問に回答する時間を設ける予定です。

 

※途中参加・退出可能ですが、プログラムの時間は前後する可能性がありますことをご了承ください。

 

■申込先:

JETRO「ASEAN知財動向報告会」お申し込みページへ

 

申し込み〆切:7月6日(火)JST 17:00

※はじめてのお申し込みの方は「お客様情報登録」(無料)が必要です。

 

・定員になり次第、締め切らせていただきます。

・定員超過によりご参加いただけない方には、ご連絡させていただきます。 

・参加者には7月7日(水)JST 17:00までに視聴URLを送付させていただきます

ので、当日のセミナーまでにご確認下さい。

・視聴URLは他の方と共有できません。セミナー当日は視聴URLにアクセスで

きるようにご準備をお願い致します。

※ご記入いただいたお客様の情報は適切に管理し、本セミナー以外には使用

いたしません。

 

※Zoomアプリをインストールする又はWebブラウザで視聴する方法がありますが、

  後者の場合はブラウザの仕様に要件があります。詳細は下記URLをご覧ください。

https://zoom-support.nissho-ele.co.jp/hc/ja/articles/360021584812-Web%E3%83%96%E3%83%A9%E3%82%A6%E3%82%B6%E3%81%A7Zoom%E3%82%92%E4%BD%BF%E3%81%88%E3%81%BE%E3%81%99%E3%81%8B-

 

■お問合せ先:ジェトロ知的財産課 

担当:[内容について]峯、今西、宮平

   [出欠について]杉山

TEL:03-3582-5198 FAX:03-3585-7289

E-mail:CHIZAI@jetro.go.jp