黒澤公人のドキュメンテーションシステムの100年(1960年-2060年)

一次情報ダイレクトアクセス時代のドキュメンテーションシステム


テーマ:
http://www.itmedia.co.jp/news/articles/0802/05/news068.html
http://www.itmedia.co.jp/news/articles/0802/05/news068_2.html

Microsoft対Googleの戦い、真の戦利品はやはり検索

 米MicrosoftとGoogleの戦いの本当の最前線を知りたいのであれば、ロンドンの大英図書館の地下室をのぞいてみるといい。

 セントパンクラス駅近くに建つ、大英図書館の赤レンガ造りの建物の地下室では、Microsoftから資金提供を受けたチームが1日14時間体制で書棚の書物を次々とスキャンしている。
AD
 |  リブログ(0)

テーマ:

GoogleがCNETに関心?CNET Japanはどうなる?

公開日時:
2008/02/12 00:44
著者:
mugendai

http://japan.cnet.com/blog/mugendai/2008/02/12/entry_25005053/




Microsoft対Googleの戦い、真の戦利品はやはり検索

 米MicrosoftとGoogleの戦いの本当の最前線を知りたいのであれば、ロンドンの大英図書館の地下室をのぞいてみるといい。
 セントパンクラス駅近くに建つ、大英図書館の赤レンガ造りの建物の地下室では、Microsoftから資金提供を受けたチームが1日14時間体制で書棚の書物を次々とスキャンしている。
 1 年前に始動したこのプロジェクトの目標は、大英図書館に大切に保管されている19世紀の書物約10万冊を対象に、向こう2年以内に2500万ページ分のコンテンツをスキャンし、デジタル化するというもの。米エール大学やコーネル大学などの図書館の蔵書も合わせて、スキャンされたコンテンツはすべて、「Google Book Search」への対抗馬としてMicrosoftが目下開発中の書籍検索サービス「Live Search Books」に用いられることになっている。
 これは、MicrosoftがGoogleに対して巻き返しを図ろうと躍起になっている分野だ。 Googleは大規模な書籍デジタル化プロジェクトで既に世界中の約100万冊の書籍をオンライン化し、世界で1万社以上の出版社、約30の大型図書館の賛同を取り付けている。
AD
 |  リブログ(0)

テーマ:
日本語ツール  パソコン、携帯電話などの漢字変換システム
        辞書や使用する漢字

けっこう難しいのは、「學問すゝめ」旧漢字、旧かな、日本語特有の表記などどをどうする。
その上,Google Book Search は、日本語の統合漢字インデックスようなものがない(?)ので、
新旧漢字を区別する。
(Google Book Searchは、世界的規模で展開しているので、日本語に特化するということも
 難しいかもしれない。中国語、韓国語などの問題があるので。NIIの漢字統合インデックスは
 日本語のみならず、中国、韓国語などと考慮して考えられている。)

Google web 検索では、かなり、検索ができるように工夫されているが。

ここで、辞書の拡大や漢字の拡大をすると、日本語の操作性をわるくするので、
適正な規模が必要。


新撰組と新選組 を、同一名称にして認識させるには、漢字統合インデックスに、この撰と選を同じ仲間だと登録する。

もともと、違う漢字なので、統合されないみたいだが。

LVZという図書館システムには、あいまい検索後度があり、このあいまい度を変化させると
新撰組と新選組を、一度に検索できるという機能がある。
この機能を、ほかの図書館システムで見かけることがないので、なにか、特殊なのだろうか?
広く、技術公開などがあるといいのだが。


日本語入力側の
問題(辞書、漢字種類、熟語)->データベースの索引
                の問題        => あいまい検索
                漢字統合インデックス    後方、前方一致検索
                漢字の正規化        関連語による検索
                長音などの正規化
----------------------------------------------------------------------
元データの問題 (人名、固有名詞、外国人名、地名、漢字の読みなど)

新撰組、新選組
オサマビンラーデン、ウサマ・ビンラディン 数種類の記述
リポジトリー、レポジトリー
エネルギー、エナジー
ルネッサンス、ルネサンス
モハメッド、ムハンマド
夜想曲 ヤソウキョク、ノクターン


これらの問題を総合的に管理する索引、正規化などのツールの出現が必要か?

Google などでは、検索語が、変だと、候補をあげてくれる



AD
 |  リブログ(0)

テーマ:
Google ヘルプセンターより

ヘルプ センター ホーム > 図書館員

図書館は書籍のデジタル コピーを入手しますか。


はい。 図書館が所蔵する書籍のスキャンを行った場合、スキャンしたすべての書籍のデジタル コピーをその図書館に提供します。 各図書館によるコピーの取り扱いは著作権法に基づきます。

-----------------------------------------------------
現在、どのくらいの量のデジタルコピーを入手したのでしょう。
 |  リブログ(0)

テーマ:
個別版Google Book Search 日本版登場(PHP研究所)


http://books.google.co.jp/books/php


既刊書籍の全文検索 スタート
当社刊で発売後1カ月以上経過した書籍の全文検索ができるようになりました(powerd by Google)。キーワードを入力していただくと、そのキーワードを本文に含む書籍がリストアップされます。是非ご利用ください。(2/22)


-----------------------------
やはり登場した。
個別版Google Book Search が登場。
これからどうなる。

次にやれそうなのは、玉川大学かな。
(慶応大学もがんばってください。)

-----------------------------
しかし、ほかの例がみつからない。
気長にさがそう。
もしかしたら、世界的にも最初の事例(???)


 |  リブログ(0)

テーマ:
電子書籍端末 激戦の時代に突入か

(次々と新製品登場)




Amazon  Kindle (ユビキタス図書の出現)

Sony Reader, LIBRIe

Panasonic Word Gear

iRex Technologies iLias (オランダ)

Polymer Vision Readius (オランダ)

富士通 FLEPia (カラー、無線LAN,ユビキタス、A5,A4)

NOKIA インターネットタブレット N800


Nintendo  DS

Apple iPhone,iPod Touch

PC、携帯電話、PDA
 |  リブログ(0)

テーマ:

http://www.asahi.com/digital/bcnnews/BCN200802260016.html

インフォコム、Web対応の図書館業務システム、システム間連携が容易に

2008年02月26日

 インフォコム(吉野隆社長)は、自社開発パッケージソフト「InfoLib」を中核とした「電子図書館システム」と連動するWeb型図書館業務システム「Hello Library(仮称)」を開発し、今夏に発売する。

 図書館利用者の貸し出し・返却や書物管理機能の「図書館業務システム」と、デジタル書籍や論文などの管理・公開機能の「電子図書館システム」を連動させるシステム。個別に稼働するシステムを連携させることで、管理コストや運用の手間を軽減できるほか、システム間での情報の整合性が取りやすくなる。

http://www.infocom.co.jp/cone_new_jp/info/press/2008/p08022201.html
[2008/02/22]
インフォコム、完全Web対応&ニューコンセプトの図書館業務システム
「Hello Library (仮称)」の販売開始


 インフォコム株式会社(東京都千代田区 代表取締役社長 吉野  隆、以下インフォコム)は、自社開発パッケージソフトウェア「InfoLib」を核とした【電子図書館システム】と、シームレスに連動する完全Web対応の図書館業務システム「Hello Library」を開発し、今夏より出荷を開始する事といたしました。
 インフォコムは、政府のe- Japan構想に連動した電子政府、電子自治体、電子図書館等のデジタルアーカイブ領域への提案を積極的に行っています。そこでは大規模なドキュメント資源を有する公文書館等の官公庁、博物館、図書館、研究所を対象に、その電子文書の管理や多彩な活用を実現するITソリューションとして、関連パッケージソフトウェアの開発・販売事業を展開しており、これまでに蓄積した経験やノウハウを活用し、前述した諸課題を解決する新しい図書館業務システム「Hello Library」を販売する事といたしました。
 |  リブログ(0)

テーマ:
Amazon は、安定した増加傾向にある。
2006年4月と2008年2月の比較をすると 和書は、当時の4,5倍に増加
洋書は、当時の2倍弱に増加したと推定される。
へたをすると、Google Book Search を越える規模に発展する可能性も大きい。


Google Book Search は、2月上旬 かなりの減少傾向をしめしたが、下旬に回復傾向にある。
原因は、不明だが、索引再作成や、大幅な書誌調整(重複チェック作業)などが、考えられるが
不明。

慶応との明治の活字本のOCR化は、ほとんどめちゃくちゃ。
いろいろ難しい問題が山済み。
Google は、不可能とも思えるようなことに挑戦するのが、好きなので、ar
どのように、江戸末期、明治時代の活字を攻略するのか、興味が尽きない。ha

MSは、ヒット件数が多くなると Thousands になるため、計測不能

Google scholar は、順調の伸び傾向にある。

次回は、2008年3月末に掲載予定


 |  リブログ(0)

テーマ:
書店で書籍を探す。
新しいものをみつけるとやってみる。

あれ! 検索できない

お金は銀行に預けるな 金融リテラシーの基本と実践 (光文社新書) (新書)

ベストセラーで、山積みなのに、検索できない なぜだ?

オカネハ では、検索できないのですね。

散々考えた挙句 オカネワ で検索してヒット。

うーん。みんなちゃんと検索できているのかな?

カタカナ おそるべし。

あまりのベストセラーで、書店のあちらこちらに、山積みだったので、検索端末で、どこの
場所を表示するかなとおもったら、新書の棚でした。
これが、定位置のようですね。

この本は購入しませんでしたが、勝間さんのGoogle化は、なんの躊躇もなく、書店でみかけて
すぐ、購入しました。


さて、2,3週間といわれる図書のサイクルを、こんな検索端末に登録しているというのは、
かなり大変な作業だろうか?
それとも、簡単なのだろうか?

1冊しかないような本もちゃんと登録されているので、毎日の配送と返送作業管理、書架管理を
どうしているのだろうか。

書店の裏を覗いてみたいなぁ。

 |  リブログ(0)

AD

ブログをはじめる

たくさんの芸能人・有名人が
書いているAmebaブログを
無料で簡単にはじめることができます。

公式トップブロガーへ応募

多くの方にご紹介したいブログを
執筆する方を「公式トップブロガー」
として認定しております。

芸能人・有名人ブログを開設

Amebaブログでは、芸能人・有名人ブログを
ご希望される著名人の方/事務所様を
随時募集しております。