[JP]検索対象、皆さんはどうされてますか?(データ編)
無効資料調査の、検索対象について考えてみる[後編]です。
前編はこちら
無効資料調査では、
登録公報を検索対象にする意味があるかどうか?
ということについて、
テキスト検索と、分類検索、その他、の
3つに分けて考えてみたいと思います。
1)テキスト検索(キーワード検索)ですと、
・ 補正が行われたとか、
・ 訂正公報が出たとか、
というケースですと、
「公開公報をテキスト検索して出なかったものが、
登録公報でヒットする。」
という可能性は否定できないです。
ただ、上記は、
公開公報にはなかった文言が、
補正で追加される、という事になるので、
可能性は低いのかな?という気もするのですが。
検証が難しかったので、
感想だけですが、ごめんなさい!
分類のほうは、簡単に検証してみました。
2)分類で検索する場合
平成17年新設のFタームで検証してみました。
平成7年~平成12年公開分のうち、
17年新設の 3H130 AA03 が何件に付与されていて、
うち、何件が登録され、
公開データ/登録データ で分類のズレはあるか?
という観点です。
使用データベースはJP-NET
こんな結果が出ました。
図には表現されていませんが、 (失敗・・・)
公開データには3H130AA03が付与されず、
登録だけに付与されているものも 21件 ありました。
まとめると、
登録されているものが 約430件 ありまして、
うち、公開データにはない分類が付与されているものが
45件ある、ということ。
公開データと登録データとでは、
公開件数に対して、約4%弱、
登録件数に対して、で見ると1割程度、
データのズレがある、と読み取れました。
但し、上記は平成17年新設タームですので、
もう少し古くからあるFタームならば、
差分が小さくなるかもしれません。
FI記号の差分も、まだ調べていないですし。。。
あぁ、継続調査決定です。 ←墓穴を掘ったかも。
検証にちょっと手間がかかるのですが(涙)、
私も 「分類つかい」 のはしくれなので、
地道にデータ収集していきたいと思います。。。
3)その他
その他、とは、
例えば
早期審査制度の登録公報のように、
登録公報しか存在しないような場合です
特に、昭和61年~平成9年6月 の期間が
サーチ対象となる場合には、
公開公報が出されないので、
少し、気をつけているといいかもしれないですね。
(次の記事でも補足します。)
※ chupuzheng さま、コメントありがとうございました!