特技懇誌に掲載された機械学習を用いた効率的な特許調査の論文です。

 

この論文では特許検索競技大会2016の問題を題材とした、機械学習を用いた先行技術調査も行っています。

しかし、確認数200件以下では、日立のShareresaech概念検索のほうが関係する文献のヒット率が高くなっています。

 

機械学習の中でも深層学習を用いる場合には、大量の学習データが必要になるとのことですが、調査案件は1件、1件異なりますので、そもそも特許調査に深層学習は向かないように思います。

 

機械学習で専門家が特徴量(パラメータ)を調整する手法を用いれば、精度の良い先行技術調査を実現をできる可能性もあります。しかし、手間の増加を考えると、概念検索に比べて優位性があるとは言えないでしょう。

 

http://www.tokugikon.jp/gikonshi/291/291kiko1.pdf

 最近ではAIの中心技術である各種機械学習のオープンソースライブラリが容易に入手可能 である。特許調査担当者の実務的な観点から機械学習を用いた効率的な特許調査の可能性について述べる。先行技術調査ではdoc2vecによる公報文書単位のスコアで査読の優先順位を付け、 文単位で発明の要素毎の類似文抽出検討を行い、13種類の教師あり分類アルゴリズムで適合判定を検討した。文単位の類似文抽出で記載の根拠箇所特定の可能性が示せた。動向調査では教師あり機械学習の 1次元 CNNによる文書分類と教師なしの次元圧縮による文書の可視化検討を行った。文書分類は SDI調査の効率化を目指している。調査目的に応じたアルゴリズムと特徴量の選択が重要である。教師あり機械学習には良質な教師データの準備が重要である。