黒澤公人のドキュメンテーションシステムの100年(1960年-2060年)

一次情報ダイレクトアクセス時代のドキュメンテーションシステム


テーマ:

最近のAIの発展がものすごい。

将棋や碁の世界では、圧倒的につよい。

NHKテレビによれば、タクシーの乗客予測までするという。

 

最近では、牧師もロボットになったとか。

 

http://www.christiantoday.co.jp/articles/23886/20170609/pastor-robot-blessu-2-reformation-500-years.htm

 

ルターもびっくりである。

 

さて、そんな風に考えてみると、Discovery もどんどん AI化して、人間の介在をできるだけ排除しているようにも見える。

 

本来、Discovery は、フルテキストデータベースを検索するという非常に単純な設計であったが、書誌情報や索引、ブックレビューなどのデータもたくさん混入しているので、それらの解決を研究しているようだ。

 

Discoveryの最大の強みは、各出版社のフルテキストを、検索専用データベースをして、安価に購入していることだ。この関係で、非公開情報も入手できるので、Googleではできない分析も可能になるだろう。

 

昔のように、CPUの能力の限界、データ量の限界というのが、問題ないので、今は、どんどん発展していく。

AD
 |  リブログ(0)

テーマ:

杏林大学井之頭キャンパスを見学する機会があった。

 

大学の中心に大学図書館が置かれたすばらしいキャンパスである。

講義棟などは、外見は非常にシンプルであるが、図書館棟は、ギリシャ・ローマ風の柱がそびえる非常にデザイン的な建物である。

 

詳細は、こちらをごらんください。

http://www.kyorin-u.ac.jp/univ/student/campus/inokashira/

 

AD
 |  リブログ(0)

テーマ:

ICU図書館は6月末に、業者による蔵書点検をする。業者一晩をかけて、図書館にある蔵書を読み込む。(ICU図書館の場合は、開架35万冊を2年で、半分づつ実施する。)

ICU図書館の場合は、あまり紛失する本は多くない。蔵書点検の大きな楽しみは、行方不明本の発見である。

図書に付けられた請求記号順に本が並んでいないと、本はすぐ行方不明になる。

貸出されていない本が、書架にない場合、学生から、探してくれという要求がくるので、担当者が探すのだが、一度見失った図書を見つけるのは難しい。本来あるべき場所にない以上、他を探しようがない。

間違っていないか、周辺を探してみても、見つかる確率はひくい。

 

学生アルバイトに余裕があるときには、シェルフリーディングという作業もある。学生アルバイトに書架を順番にチェックしてもらい、間違った請求記号の本をみつけたら、正しい位置に直してもらう。アルバイト学生は、授業の空き時間をつかってアルバイトをしているので、一度に、作業できる量も知れているので、実に、気の長い作業でもある。しかし、本を探す方法といえば、そのような方法ぐらいしかない。

図書館内部で、蔵書点検をすることも試みたこともあったが、最近は、図書館の図書の蔵書点検は、

経理の監査にも必要になっているので、業者による蔵書点検を行うことになった。

財産が本当にあるかという証明が求められている。紛失本は、除籍することが求められており、いつまでも行方不明本だといっていられない。しかし、蔵書点検をして、その時、不明本だからといって、直ぐに除籍することはできない。しばらくすると、出てくることがあるからだ。どこからでてくるのか、なかなか説明しがたいのだが、どこからとなく、図書が出現してくるのである。

 

蔵書点検をしたあとのデータは、図書館システムの蔵書点検システムに取り込むと、問題リストを作成してくるので、その後始末に追われる。データの所在場所が間違っていたりする。貸出中の本がみつかることがある。返却漏れなのかもしれないし、学生が、間違って、書架に戻してしまったのかもしれない。

本来、自動化書庫に戻るべき、本が、開架書架に間違っていってしまうケースは多い。しかし、それらも、正しい請求記号の位置に置かれていれば、みつかるのだが、間違った場所におかれると、やはり、判らなくなる。

 

返却された本や、利用された本は、一度、サーキュレーションデスクに集められて、訓練されたアルバイト学生によって、書架にも戻されていくのだが、必ずしも、正しい位置に戻されるとは限らない。

ICU図書館の請求記号は非常に複雑で、アルバイト学生も、訓練とテストをしないと、作業させない。

それでも、図書が、間違って配架されてしまうことが、発生する。

 

図書館システムの蔵書点検システムは、大きな問題は、リストアップされるが、請求記号の前後の入れ違いなど、細かいことはチェックしない。細かいことまで、チェックすると、とんでもない量のリストをつくることになるので、システム的にはできない。

 

では、どうするかというと、図書館システムで、蔵書ファイルを作成するという機能をつかって、蔵書点検をした図書番号順に、そのまま、書名や、請求記号のついたファイルを作成する。20万冊蔵書点検したら、その20万冊分のリストを(ここは、重要)、蔵書点検したファイルそのままの順番で吐き出す。

蔵書点検は、一度に、何十人もの人間が取りかかって作業をするので、そのファイルは、別に書架順に並んであいるわけではない。強いて言えば、結構、ランダムっぽい感じである。

しかし、このファイルをExcelにして、パソコン上においておくと、とんでもない強力なツールとなる。行方不明本の図書番号を入れて、検索すると、とんでもないところに本があることが、一目瞭然でわかるのである。図書は、毎日、毎日利用されていくので、蔵書点検した状態は、日々、どんどん崩れていってしまうので、完璧ではないのだが、どうしても、見つからない本をみつけだすファイルになる。

 

--------

自動化書庫の蔵書点検はできない。

自動化書庫の中は、ランダムに入庫されている。

出納ステーションに出てくるコンテナの入出庫作業時が、コンテナの中が正しい冊数なのか、調べられる唯一の機会なので、その機会に調べる。

すると、不一致の例が見つかるので、それは、時間があるときにじっくりと調べる。

コンテナの中の本が多い時は、割と簡単にわかるが、コンテナの中の冊数が少ないとなると、それを探り当てるのは、なかなか面倒になる。

実際、そのようなトラブルを探してみると、不思議なもので、トラブルのある本は、最初にはみつからず、いつも、最後のほうに隠れている。いたずらっ子が、先生に見つからないように、友達の陰に隠れているのに、よく似ている。

 

---------------

このブログのタイトルは、自動化書庫はマジックボックスであるであるので、そのことを書かなくてはならない。

図書館で、やっかいのは、小規模コレクションの管理である。数十冊、数百規模のコレクションを別置するには、厄介である。

しかし、自動化書庫は、別置とか考える必要がない。複数の図書館の分類番号が違っている本や、分類番号のない本でも管理可能なのだ。

 

自動化書庫は、1冊づつ取りだすことを前提に考えれば、実に、マジックボックスといっていい存在である。

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

AD
 |  リブログ(0)

テーマ:

大規模書店というのがある。ビル一つや巨大なフロアーが、書棚に本が埋め尽くされており、ほしい本を、買い手が探す。実に、それも楽しい行動でもある。

しかし、しばしば、探したいという本がなかなか見つけ出せないで、苦労することもある。

 

探し出したい本がはっきりしているときは、アマゾンの方が便利だ。検索して、クリックすれば、あとは届けてくれる。(アメリカでは、本の価格は一律でないので、安く買えることもある。日本でも古本は、値段を自由についてもよいが)

 

さて、東京大学に巨大な自動化書庫 300万冊ができたという。(運用は、すこし先になるが)

 

自動化書庫には、目録データがある資料で、登録番号があれば、どんな順序、どんな場所にいれても問題ない。場所を固定していれる方法もあるが、場所を固定してしまうと、戻す作業がたいへんになる。なので、基本は、フリーロケーションを呼ばれる、場所は固定されない運用になることが多い。

(固定とフリーの共存も可能だが。)

 

さて、利用者にとって、巨大自動化書庫とは、アマゾンのようなものと考えればよいだろう。

(アマゾンといっても、実に多彩なものを売っているので、ここでは、普通の本をうっているアマゾンという

 意味で書いている。)

 

いままで、書架の隅や研究室の中にしまわれていた本が、これからは、自由に利用できるようになる。

 

このように書くと、自動化書庫がゴミダメになってしまうという意見に遭遇する。たしかに、ゴミダメのようになってしまうというイメージは、嘘ではないように思う。しかしながら、書架では絶対管理できないような薄い冊子やパンフレットのような資料でさえ、目録がとってあれば、利用可能になる。ゴミのような資料さえ、活用を可能にする。

さすがに、300万冊の巨大な自動化書庫といえども、その容量には、限界があるが、しばらくは、大丈夫だろう。当面、なにをどのように入れるかが、問題だろう。

 

ひとつだけ、面白いことを教えておく。

150万冊までは、出庫、入庫速度は、あまり変化しない。150万冊を超えだすと、奥側のコンテナな利用をされるようになるので、出庫、入庫速度は遅くなる。それは、10年後、20年後の話かもしれない。そのころに、その違いに気づける人もいないのかもしれないが。

 

さて、運用5年目あたりで、100万冊以上入庫されていると、大成功と思われるが、どのような運用をするのかが、楽しみである。運用5年目あたりで、50万冊以下のようだと、あまり、成功したとは言えないかもしれない。

 

 

 |  リブログ(0)

テーマ:

東京大学図書館の自動化書庫が完成したというのを聞いた。建物空間の湿気を抜く必要があるので、

自動化書庫への入庫作業は、しばらく先になるそうだ。

 

さて、300万冊の図書をどのように管理するのか、いろいろ気になるところである。

自動化書庫には、書架では、絶対できない特技がある。

 

図書館の図書には、請求記号というものがついている。

昔の図書館の書架には、利用者が入ることはできなかったので、図書についている請求記号を調べて、図書館の人に、図書を探して取りだしてもらう必要があった。(図書を請求するための記号)

その請求記号は、図書の排列順を決めるものである。

図書館の本には、棚の位置を確定する絶対番地のような請求記号が必ず、必要なのだ。

それは、分類でなくても、アルファベット順でも、番号順でもなんでもいいのだが、なんらかの番号を必要なのだ。

 

ところが、自動化書庫には、たくさんのコンテナがあって、そのコンテナに本をいれるので、そのコンテナが、その本の所在場所になるので、請求記号は必要ではない。自動化書庫の中の本は、基本的にはランダムなので、分類や文庫などもランダムになっている。入庫する時は、きちんといれることができるが、それが、年間10万回、20万回と出庫されると、それは、利用されて、別のコンテナにもどるので、いつしか、自動化書庫の中はどんどんランダムになる。

 

たとえば、ICU OPACで

 

地方公益経済圏の創定   という図書をさがすと、請求記号のついた図書と、請求記号のない図書(******で表現されている)が2冊でてくる。共に、自動化書庫に入っているのだが、

別々のコンテナに入っている。 ****** は、分類されずに、自動化書庫に入庫された本である。

 

 |  リブログ(0)

テーマ:

さて、130周年を無事迎えるために、中央公論の巻号を調整するということを行った。

中央公論は、長年、年号の組み合わせで、刊行してきた。それを、130周年に合わせるために、128年(2013)、129年(2014)、129巻(2015)、130巻(2016)、131巻(2017)と、年号から、巻号に変更した。

コンピュータシステムは、例外に弱い。多くの雑誌が、巻号を基準に発行を管理しているので、年号、巻号の微妙な変更は、対応不可に近い。

 

国会図書館の記事索引で、2014年8月の記事を検索してみると

新帝国主義的な動きをどう封じ込めるか 世界にはリベラルな民主主義しか残されていない (特集 中露の膨張主義 : 帝国主義の再来か)

G・ジョン アイケンベリー,白川 義和 聞き手

掲載誌 中央公論 129(8) (通号 1569) 2014-08 p.82-87

 


ICU Discvery で検索してみると

 

2015年6月の記事では

 

国会図書館サーチ

そして、中央アジアでの覇権争いが始まる 習近平、プーチン演ずる「新・世界秩序」の舞台裏 (特集 中露急接近で何が起きるか)

フランシス フクヤマ,会田 弘継

掲載誌 中央公論 129(6) (通号 1579) 2015-06 p.80-87

---------------------------

中央公論が、工夫した 129年、129巻は、索引の処理上では、無視されて、ともに、同じ129 に

なっている。

 

ICU Discoveryの場合、ICU OPACにリンクして、現物の雑誌の所蔵を指し示しているだけなので、特に、129年、129巻は問題にはならない。

 

 

今後、雑誌記事のデジタル化や、その記事固有の絶対番地が確定してくるので、129年、129巻などという問題は、瞬く間に解決してしまうに違い。

 

こんなことをグチグチ言い出しているのは、単なる図書館員の嫌がらせとも考えれられる。(嫌がらせではなく、こだわりだ。)

 

------------------------------------------------

さて、雑誌を眺めていると、本当の問題は、年号、巻号という問題は、どうでも、いいような問題だということがわかる。

 

中央公論、アエラをはじめ、雑誌の記事タイトルの複雑さは、半端ない感じなのだ。

多くの問題は、特集の多さ

 

サブタイトルなのか、タイトルなのかさっぱりわからない付け方。

 

中央公論 130巻3号の56ページの記事をみると

朴政権はどこへ向かうのか 変曲点に立つ韓国外交 (特集 韓国豹変の深層)

朴 喆熙

掲載誌 中央公論 130(3) (通号 1588) 2016-03 p.56-61

 

また、68ページをみると

「四割が非正規雇用」を論じる前に 「正規」と「非正規」の線引きをやめよう

玄田 有史

掲載誌 中央公論 130(3) (通号 1588) 2016-03 p.68-76


正式な記事タイトルの前に、形容詞のようなタイトルがついている。
なんとも、複雑な構造をなしているような気がする。

雑誌記事索引担当者は、ほんとうに、たいへんなお仕事だと改めて、考えさせられました。
 

 

 

 

 

 

 

 |  リブログ(0)

テーマ:

では、具体的に、データベースを設定するのだろうか

 

SerialsSolutions というメニューを眺めてみると

 

360 Core

360 Link

Summon

 

のチェック欄がある。

 

これをどのように使い分けるのかというと

 

360 Core  雑誌タイトルリストに登録

http://www.sunmedia.co.jp/e-port/serialssolutions/cat35/ams/

 

360 Link 2次情報からのフルテキストへのナビゲート

http://www.sunmedia.co.jp/e-port/serialssolutions/cat35/360_link/

 

Summon summon で検索できるようにする

http://www.sunmedia.co.jp/e-port/serialssolutions/summon/

 

もっとくわしく知りひとは、こちら

http://www.sunmedia.co.jp/e-port/serialssolutions/

 

 

 |  リブログ(0)

テーマ:

ICU図書館に好奇心いっぱいの優秀な若手職員がいる。

 

ICUでは、ProQuest Summon をICU Discoveryと呼ぶ。

 

仕事をしていると、ちょっと質問があるんですが、やってきて、根ほり葉ほり、疑問に思ったことを聞いてくるので、まあ、できるだけ、判りやすいように答えてみる。

 

ICU Discovery で、どのようなものが検索できて、どのようなものが検索できないのか、よくわからないという。どうも、学生にいろいろ問われたらしい。

 

そこで、私もいろいろ考えてみる。そこで、登場したのが、ICU Discovery 鍋理論

 

ICU Discovry 鍋理論

ProQuest Summon は、一つしか存在しないが、それぞれの契約している大学毎に、データベースを

選択して、その大学に適した環境につくりあげる。

 

たとえれば、ここに巨大な鍋がある。その一角に、ICU専用の区画をセットする。

その区画は、最初は、空っぽだが、そこに、オックスフォードだ、ケンブリッジだのを自分の区画に放り込んでいく。(ほうりこめるのは、巨大な鍋の中にあるものだけ。日本のデータベースなどは、対応していないものも多いので、放り込めないものを多い。ジェトロ・アジア経済研究所などが、組み込まれると、日本にとって、朗報だと思うが。ProQuest Summon では、記事を購入するので、ジェトロ・アジア経済研究所もちょっとした副収入になるはずだが。といっても、聞くところによれば、検索用に購入するので、1記事あたり、とても安いらしい。しかし、検索対象になるだけなので、その記事自体が、公開されてしまうわけでないので、単純な副収入と考えて問題ない。Japan Timesなども検索できるといいと思う。(Japan Timesは、記事数が多そうなので、記事単価が安くても、よい臨時収入になりそうな気もするが。)

 

ProQuest Summonには、オックスフォードやケンブリッジのデータは、丸ごとはいっている。フルテキストとしてはいっている。だから、ProQuest Summonを検索すると、フルテキストを検索しているのだが、

契約上、使用目的上、そのフルテキストを見せることがないので、本来あるべき場所に案内に、それが見ることができるかどうかは、その大学とオックスフォードやケンブリッジとの契約による。

つまり、鍋の中は、フルテキストデータベースは存在するが、それは、検索だけで、それを見ることができない。

 

さて、ICU Discovery で、なにか見えるかは、その鍋から、ICU の区画に取り込んだものが、検索でき、その元の場所に案内される。取りこまれていないものは、検索もできない。検索できるものは、放り込んだものだけだ。

 

ここに ICU Discvery 鍋理論が完結したわけだ。

 

というわけで、ICU Discovery の登録済データベースを渡してみる。

 

なかなか、彼は、熱心な職員だ。

 

あの、和雑誌の検索がうまくいかないんですが。

 

和雑誌は、ほとんどデジタル化されていないので、うまく検索できません。

 

でも、検索されますけど。

 

それは、国会図書館の雑誌記事索引を放り込んであるので、そうなるの。

国会図書館の雑誌記事索引は、たんなる索引で、本文には行き当たらないのです。

 

でも、本文に行き当たるものもありますよ。どう判別するんですか?

 

まあ、なかには、そうなるのもあるし、ならないものもあるし、和雑誌は、やってみないとわからないね。

今度、ICU Discovery の講習会をやるので、ProQuest 人がくるので、質問をまとめて、聞いてみなさい。

 

はあーい。

 

そして、当日。

いろいろ質問事項まとめておきました。ジャーン 5ページ作成

 

おいおい、そんなによく質問を見つけたな。

 

質問です。こんなことはできないんですか?

 

「おいおい、そんな無茶な質問はないでしょう」と思って聞いていると、

 

ProQuestの担当者は、こうすれば、出来ますが、やってみますか、。

反映するのに、10分ほどかかりますが。

 

「え!、そんな簡単にできちゃうの。知らなかった」

 

解説

彼の質問

詳細検索の限定子 「全てのフィールド」は、一番最初にくるべきだ。

 

ProQuest の担当者の対応

ここは、アルファベット順、文字コード順にならんでいるので、 ひらがなで、「すべてのフィールド」

と、すれば、先頭になります。

 

黒澤の反応

「唖然!!  ええ! そうなの、知らなかった」

 

 

あの、国立国会図書館の雑誌記事から、OPACにリンクさせたいんですが、

 

ProQuest の担当者、

国会図書館の雑誌記事索引データベースの設定を、チョイチョイと変更して

ICU 所蔵データの設定を、チョイチョイと変更して。

これで、2,3日熟成させると、おいしい鍋になります。

いや、使い勝手のよい ICU Disvoeryに。

 

すると、JAIROやCiNIIもうまくチューニングすれば、美味しい鍋に

いや、使い勝手のよい ICU Discoveryに。

 

この若手職員の好奇心は尽きない。その好奇心が、ICU Discvoery を

どんどん進化させて、使いやすいもの変身していく様を目の当たりに

みるのは、実に楽しい。

 

 

 

 

 

 

 

 |  リブログ(0)

テーマ:

あらためて、国会図書館の雑誌記事採録基準を探してみた。

確かにすごい仕事だな。

すごい忍耐力の仕事だと思う。
自動化なんて、とても、できないだろうな。

国会図書館の

雑誌記事索引について

 

 

 

 |  リブログ(0)

AD

ブログをはじめる

たくさんの芸能人・有名人が
書いているAmebaブログを
無料で簡単にはじめることができます。

公式トップブロガーへ応募

多くの方にご紹介したいブログを
執筆する方を「公式トップブロガー」
として認定しております。

芸能人・有名人ブログを開設

Amebaブログでは、芸能人・有名人ブログを
ご希望される著名人の方/事務所様を
随時募集しております。