[JP]検索対象、皆さんはどうされてますか?(データ編) | 情報検索、プロの視点/酒井美里ブログ

[JP]検索対象、皆さんはどうされてますか?(データ編)




無効資料調査の、検索対象について考えてみる[後編]です。





前編はこちら













無効資料調査では、


登録公報を検索対象にする意味があるかどうか?


ということについて、








テキスト検索と、分類検索、その他、の


3つに分けて考えてみたいと思います。








1)テキスト検索(キーワード検索)ですと、





 ・ 補正が行われたとか、


 ・ 訂正公報が出たとか、





というケースですと、





「公開公報をテキスト検索して出なかったものが、


 登録公報でヒットする。」





という可能性は否定できないです。








ただ、上記は、


公開公報にはなかった文言が、


補正で追加される、という事になるので、


可能性は低いのかな?という気もするのですが。








検証が難しかったので、


感想だけですが、ごめんなさい!








分類のほうは、簡単に検証してみました。











2)分類で検索する場合





平成17年新設のFタームで検証してみました。








平成7年~平成12年公開分のうち、


17年新設の 3H130 AA03 が何件に付与されていて、





うち、何件が登録され、





公開データ/登録データ で分類のズレはあるか?


という観点です。











使用データベースはJP-NET


こんな結果が出ました。



































































図には表現されていませんが、  (失敗・・・)





公開データには3H130AA03が付与されず、


登録だけに付与されているものも 21件 ありました。








まとめると、





登録されているものが 約430件 ありまして、


うち、公開データにはない分類が付与されているものが


45件ある、ということ。 





公開データと登録データとでは、

公開件数に対して、約4%弱

登録件数に対して、で見ると1割程度、

データのズレがある、と読み取れました。




但し、上記は平成17年新設タームですので、


もう少し古くからあるFタームならば、


差分が小さくなるかもしれません。





FI記号の差分も、まだ調べていないですし。。。











あぁ、継続調査決定です。 ←墓穴を掘ったかも。ahaha;* 








検証にちょっと手間がかかるのですが(涙)、


私も 「分類つかい」 のはしくれなので、


地道にデータ収集していきたいと思います。。。








3)その他





その他、とは、





例えば


早期審査制度の登録公報のように、


登録公報しか存在しないような場合です





特に、昭和61年~平成9年6月 の期間が


サーチ対象となる場合には、





公開公報が出されないので、


少し、気をつけているといいかもしれないですね。


         (次の記事でも補足します。)








※ chupuzheng さま、コメントありがとうございました!