図書(洋書)の中身を検索する方法として、現在2つの方法が知られている。
ひとつは、Google Print である。現在、ものすごいスピードで図書のスキャニングとOCR化がされており、最終的には、数百万冊規模に達する予定である。
現在 その全体のコレクション(数十万冊(?))の本文中の単語で検索でき、その該当ページを見ることができる。

AMAZON も洋書のスキャニングを初めており、該当図書にLOOK INSIDE の表示があれば、その図書の本文の中で、使われている言葉、 たとえば、コンピュータに関心のある人は、COMPUTER と入れれば、その図書の本文中のどこで使われているのかを知ることができ、その該当ページをみることができるので、どのような文脈でそれが使われているのかを知ることができる。

現在、図書といわず、あらゆる、文章が、キーボードから作成されている。OCR技術の発達により
印刷物をほとんど、文字としてデータ化が可能になった。

図書は、基本的に出版社がその原稿をもっているのだが、現在、急速にインターネットに関わる
GoogleやAmazonがデジタル情報(大量に持つ)時代になりつつある。

Google Print, Amazon も新しい図書をたくさんスキャニングしていますね。