黒澤公人のドキュメンテーションシステムの100年(1960年-2060年)

一次情報ダイレクトアクセス時代のドキュメンテーションシステム


テーマ:
テストデータ

Tokugawa Political Writings

By Najita, Tetsuo Najita

Amazon.com の キーワード


Key Phrases - Statistically Improbable Phrases (SIPs): (learn more )
nourish human virtues , inner human nature , realizing virtue , ooo koku , clear virtue , human nourishment , princely ruler , ethical intent , benevolent person , seventy disciples , three dynasties , ultimate norm , philological method

Key Phrases - Capitalized Phrases (CAPs): (learn more )
Ancient Kings , Tzu Ssu , Way of the Sages , Chu Hsi , Sung Confucianists , Sung Confucians , Lao Tzu , Doctrine of the Mean , Book of Changes , Ch'eng Tzu , Six Classics , Way of Heaven , Book of History , Book of Rites , Duke of Chou , Kao Tzu , King Wen , Tseng Tzu , Tso Chuan , Tzu Kung , Tzu Hsia , Liu Hsia-hui , Hundred Schools , Kuan Chung , Shao Yung


Googleのキーワード

Key terms
sorai , ancient kings , mencius , confucian scholars , daimyo , chu hsi , confucianists , lao tzu , seidan , inner human , confucians , benevolent person , bakufu , chou dynasty , tokugawa , tso chuan , chuang tzu , liu hsia , maruyama masao , shen nung


このキーワード抽出能力によって、取り出されたキーワードを比較すると、関連性の高い図書を探し出すことができる。

固有名詞、人名などは、共通点がみられるが、かなりの差がある。
どのくらいの数のキーワードを取り出すかによっても、大きな違いがでる。
Googleの場合は、図書の中を検索するが、Amazon.com の場合は、そのキーワードが存在する他の図書を検索する。



AD
 |  リブログ(0)

テーマ:
4月18日より、Google Book Searchのデータ増加量を定点観測してきた。その結果 4月18日当時に比べて
Google Book Searchのデータ量は約5倍になったと推定される。

定点観測用に用いたキーワードは japan,america,economic,science の4つで、
4月18日当時
 japan 2640000
america 9720000
economic 10400000
science 10400000
であったが、11月30日現在は、

(Google Book Search,Google ブック検索のサーバーは複数あるので、サーバーによって若干の違いが
見られる。ここでは、Google Book Search ロゴ表示サーバー数字を用いた。)

japan 8200000 約3.1倍
america 70500000  約7.2倍
economic 48000000  約4.6倍
science 42000000  約4.0倍

平均 4.7倍 となった。
この7ヶ月間で約5倍程度の増加になったと推定される。
この推定は、あくまで、英語圏の図書の増加量で、日本語、中国語、スペイン語などを加えると、
もっと、多いと推定される。

データの重複問題を考えると、スキャンデータは、増加量の数倍から10倍程度の量に達しているのではないかと
思われるが、実態は不明である。


AD
 |  リブログ(0)

テーマ:
Google Book Searchで、 インプレスジャパン と検索すると、14冊ほど出てくる。
(面倒くさいことに Google ブック検索では、この検索できない。)
これらの図書は、Full View Books になっている。

この本に出ている日本語では、検索できないかが、 Google とか Wiki で検索すると,それらが検索され、
黄色いマークが表示される。
(Google Book Search, Googleブック検索の両方で検索可能)

まずは、英語のみの検索を提供しているようだ。



AD
 |  リブログ(0)

テーマ:
日本語選択機能付き 登場
http://scholar.google.com/intl/ja/



Google Scholar

- [ このページを訳す BETA ]
Provides a search of scholarly literature across many disciplines and sources, including theses, books, abstracts and articles.
scholar.google.com/ - 3k - キャッシュ - 関連ページ
Advanced Scholar Search - scholar.google.com/advanced_scholar_search
About Google Scholar - scholar.google.com/intl/en/scholar/about.html
について - scholar.google.com/intl/ja/scholar/about.html
Scholar Help - scholar.google.com/intl/en/scholar/help.html
他、scholar.google.com内のページ »

Google Scholar

Google Scholar. Scholar 検索オプション · Scholar 設定 · Scholar ヘルプ. ウェブ全体から検索 日本語のページを検索. 巨人の肩の上に立つGoogle ホーム - Google の概要 - Google Scholar について - Google Scholar in English. ©2006 Google.
scholar.google.com/intl/ja/ - 3k - キャッシュ - 関連ページ
 |  リブログ(0)

テーマ:
新しい言文一致運動がおきていると、何回か書いた。
この言文一致運動を起こしている要因は、キーボードから文字をつくることになったからである。
英語の場合は、キーボード入力文字と打ち出される文字は一対一対応しかありえないが、
日本語は、キーボード入力どおり、文字が表現されているわけではない。
このキーボード入力では、すべて、一度、音変換されて、そこから、新たな漢字、ひらがな、
カタカナなどに変換されなおすことになる。

このことによって、日本語は、ますます、音表現言語に移行していく。
新聞、マスコミ、テレビは、常用漢字世界にしばられて、破綻は,破たんへ ますます、音表現にたよって
いかなければならない。
多くのマスコミが、縦書き表現をとるため、(News Weeks 日本語版すら)、英語などの言葉に対応する術がなく、
人名、地名、をはじめ、あらゆる言葉を、音表現だけに変換しようとする。
(アジアなどの文字変換きた例もある。レーガン、リーガンという変換もあった。)

日本語の音素の少なさを、漢字などでカバーして文化がなりたっていたのに、
音素、アクセントなどの文字表現能力をますます低下させながら、
漢字を排除しながら、英語などの音のみを表現するという最悪のパターンを辿っている。

そのくせ、国会議員は、ときどき、わけのわからないような 漢語用いて、悦にいっている。

なんだか、数学を、整数と四則演算ですべて計算できると教えておいて、方程式ができないとか、
分数や小数ができないといっているようにみえる。
コンピュータディスプレイにたとえるなら、256色表示できないディスプレイをもってきて、
絵や写真のような再現力がないといっているようにみえる。

現在日本語が力をもつためには、漢字の復権と、英語などの源綴りの取り込みが
いたしかたないだろう。
国語辞書の整備、コンピュータ入力における日本語入力の研究、
ローマ字表記問題

もういちど、現代かな使いのありかたの再検討も必要であろう。
ここまで、めちゃくちゃになった日本語を再構築するのは容易ではないが、
戦後の日本語の大変化をみれば、日本語のどのような再構築も大発展も可能であろう。

かつて、中国で、たくさんの本を無用とものとして、焚書されたことがあったが、
戦後から現代に至る道は、日本語の焚書の時代であったといえるかもしれない。
そういう位置づけになることを願っている。


と、書きながら、30分警告がでた。
同時に、誤字、脱字が多いのに、なぜ、これほどまでに、勝手な日本語論を展開するのは
解せない気もする。

 |  リブログ(0)

テーマ:
11月21日に、Google Book Searchのインターフェースが変化したことを書いたが、その後、正式な発表も
あった。


Google,書籍検索サイト「Google Book Search」を機能強化
ITpro - 2006年11月23日
Googleは同社の書籍検索サイト「Google Book Search」に拡大/縮小表示などの新機能を追加した。同社ソフトウエア・エンジニアのNathan Naze氏が米国時間11月21 ...
Google Book Searchにズームなどの新機能 ITmedia
関連記事 2 件 »
スクロールでページがめくれる「Google Book Search」の新UI公開
INTERNET Watch - 2006年11月21日
Googleが書籍検索サービス「Google Book Search」のユーザーインターフェイスを大幅に改良したことが21日までに明らかになった。 新しいユーザーインターフェイスでは ...


----------------------------------------------------------------------
なかなか画期的なシステムの登場である。
しかし、次なる手を考えているにちがない。
日本語(縦書き、右開き問題)にどのような発表をするのか、興味津津ですね。









 |  リブログ(0)

テーマ:
Google Book Searchには、台湾、韓国の図書も収録されている。

あまり、中国や台湾、韓国の図書について関心がないので、詳しくしらべていないのだが、
最近の本は、ほとんど、横書きなのではないか。

日本も、文学作品を除き、横書きに統一したらどうか。

やはり、新聞、週刊誌、単行本の横書き を、推奨すべきではないか。

英語などの外国語の親和性、コンピュータなどの操作性を考えて、みてはどうか?

最近、世界の中で、縦書き本(雑誌、新聞、図書)の統計を調べてみよう。

まずは、新聞横書きを行おう!!!
 |  リブログ(0)

テーマ:
私の勤務する大学は3学期製なので、本日をもって、2学期(秋学期)が終了する。
また、12月5日から、授業登録(学期ごとに各自授業登録をするというとてもたいへんな大学です。)が
はじまり、3学期になる。

怒涛のような試験期間が、試験期間も終盤になってきると、図書館にも落ち着きが取り戻せるようになる。
パソコンもちらほら、空席ができて、強制的に荷物の引き上げはしなくてよくなる。

学生たちは、しばらく、学期外の授業のない期間になり、図書館も夜間開館をしばらくしなくなる。
コンピュータ担当者は、この期をまって、利用者用パソコンのプログラムのバージョンなどの調整作業がおこなう。

12月になると、3学期が始まってしまうので、亡年会は11月中にやろうと、準備が始まっている。

貸し出された膨大な図書が次々と返ってきて、書架の隙間が、だんだん埋まっていくのがわかる。


 |  リブログ(0)

テーマ:
Google Scholar は、どのように記事をあつめているのだろうか。

いろいろ検索してみると図書の書誌が検索されるので、なぜだろうをおもうと、
論文中に参照文献と掲載されているとそれが、書誌として一項目登場する。
その図書の書誌とその論文が関係 Cited by がうまれる。

さて、それらの論文はどのようにあつめているのだろうか。
どうも、JStage あたりからのみのデータ収集ではないようだ。
Web上に公開されている情報もかなり収集しているようだ。

オリジナル文献のみではなく、参照文献から作成したデータもかなり載っているので実態の把握は
非常に難しいと思われる。
この参照文献から作成された書誌は、結局のところ、本文参照するためのウエイティング(待ち行列)
リスト(いずれ本文を見つけ出して表示できるのを待っている状態)をして登録されているにちがいない。


Google Scholar の定点観測も必要か?

日本 107万件
アメリカ 18200件
経済   96000件
科学   435万件


紀要 8730件
論叢 2470件

科学、日本あたりは、中国などの論文が混ざりこんでいる数なのでなかなか識別しにくい。

ときどき、様子をみることにしよう。
とんでもない情報寮にふくれあがっているのかもしれない。
 |  リブログ(0)

テーマ:
Google 自体が、壮大な実験場のようだ。
たぶん、大きな目標があるのだろう。

Google Book Search, Google ブック検索の定点観測を続けている。
現在、2つのブラウザーと、2つのパソコンを駆使して、観測中。
観測データも複数になっているので、とんでもないことになっているのだが、
まあ、とにかく、観測あるのみ。

さて、今日の遭遇状況をつたえよう。
キーワード分析と関連図書の表示が追加になった。

いままで、Amazon.com の洋書で、テキスト分析機能があったが、Googleは、そのようなことをしないのだと
思って、主に、テキスト分析の紹介するときは、Amazon.com を紹介してきたが、いよいよ、Google でも
テキスト分析を開始した。

このことによって、図書の関連性、似たような図書の分析が可能になる。

また、一歩、大きく、歩みを進めた。

すごいぞ、 Google

日本語ブック検索は、まだのようだ。

 |  リブログ(0)

AD

ブログをはじめる

たくさんの芸能人・有名人が
書いているAmebaブログを
無料で簡単にはじめることができます。

公式トップブロガーへ応募

多くの方にご紹介したいブログを
執筆する方を「公式トップブロガー」
として認定しております。

芸能人・有名人ブログを開設

Amebaブログでは、芸能人・有名人ブログを
ご希望される著名人の方/事務所様を
随時募集しております。