黒澤公人のドキュメンテーションシステムの100年(1960年-2060年)

一次情報ダイレクトアクセス時代のドキュメンテーションシステム


テーマ:
世界一難しい漢字(もじ)を使う日本人 http://www.amazon.co.jp/exec/obidos/ASIN/4047041319/250-3716965-4189820 
     こんなタイトルの本があるくらいだから、きっと、そうなんでしょう。 日本語が悪魔の言語か http://www.amazon.co.jp/exec/obidos/ASIN/4925112198/250-3716965-4189820 そういったのは、フランシスコザビエル ではないかと書いてありましたが、 漢字の音の多さ、多様性は、カタカナ、ローマ字のどころの多様性ではありません。 それを、考えると、カタカナ、ローマ字なんて、混乱のうちには、入らないといえるかもしれません。 漢字には、音訓の問題、漢音、魏音など、中国の時代毎の漢字の音変化もそのまま、日本語になっています。 この複雑さは、なみ並大抵のものではありません。 きっと、フランシスコザビエルの海外布教をする人なので、言語の達人だったにちがいない。そのフランシスコザビエルを、こんな言語があるのだろうかといった(?)らしいのですが、そうかもしれません。 前回、ルネサンス、ルネッサンス問題を取り上げましたが、 日本 を、どう読む、ことすら、日本人は、決められずにいます。 (おそるべき、国民性です。) 日本のことが、外国の人が、ジパング、ジャパンと表現するところから 考えてみると、昔の人は、日本を、ニッポン といっていたのではないかと 思われます。そして、例によって、促音や濁音、拗音を、文字表記上から 省かれて、ニホンが、生まれたのではないかと、勝手に考えてみます。 同音の多さ 市立、私立  国立(こくりつ、くにたち)など、漢字 や音からという側面から判断できない問題があります。 ある校長先生が、記者の質問に、それは”かてい”の問題と応えたばっかりに 記者は、それを家庭の問題として記事を作成した。ところが、当の校長先生は 記者の質問を、”仮定”の問題だと答えだけだった。という話があります。 日本語の難しさがあります。 それを、コンピュータで扱うのは、なかなか、たいへんです。 少なく見積もっても、2000年以上の歴史が重なっていますから。 日本語のルーツもなかなか、わからないようです。 日本オリジナルの言語なんでしょうか。
AD
 |  リブログ(0)

テーマ:
あなたは、どちらのカタカナになじみがありますか。

ルネッサンス
ルネサンス

どちらも同じことを表現しています。
このカナになった元の英語は、なにも変化していないのに、
なぜか、日本語のカタカナ表記が、いつしか変化しています。
この変化を決めたのは誰なんでしょう。

不思議ですね。トリビアになりそうですね。

実は、ローマ字には、同じ子音 ss, tt, とかが重なると 促音 っ、ッ と
いった音になるというルールがあるため、この子音の重なりのある英語単語を
みると、英語で実際にどう発音されているのか関係なく、促音をいれてしまうという傾向があった。しかし、実際の英語を聞いてみると、促音がないので、最近は、促音のない表記になりつつある。
しかし、どうして、かってに変化していいのだろうか。

この変化で、図書館で、ルネッサンスのことを調べたい人が、ルネサンスという表記に気が付かないと、きちんと本と見つけ出すことができませんね。

カタカナの表記が、時代によって、どんどん変化していくことを、日本人は堂考えているのでしょうか。
このルネサンス、ルネッサンスのような例は、ハッピー、ハピーなど、
たくさんの例があります。
今使っている カタカナ語は、10年後には、またちょっと、違っているのかもしれませんね。

長い、文章ばかり書いて、きっと、読者に嫌われているに違いない。
誤字脱字も多いし。 (ごめん。ぐすん。直している時間がない。。。)
AD
 |  リブログ(0)

テーマ:
日本語をローマ字で表現きるのか?ある調査によれば、吉祥寺という表記が、70種類以上あるという調査も報告されている。それらのバリエーションの可能性を数えると、120種類以上の表現がありうるという研究がある。いったい、ローマ字となんなのであろう。
たとえば、 kichijouji kitijoji kitijouzi など簡単に思いつくことができますね。
キ ki
チ ti,chi
ジョウ jo,jyou,zyou ....
ジ   ji,zi
などに分解されます。それらの組み合わせで、いろいろな表現が可能になります。なぜ、図書館の問題なのにローマ字やカタカナが問題になるのでしょうか。図書データは、漢字などで書かれた書名について、カナ読み、ローマ字読みをつけることが規則上定められています。(それをどのように運用するかは、それぞれの事情によりますので、必ずしもずべての図書館がそのカナ、ローマ字の両方をつけるかは、事情により異なります。)この厄介なローマ字を、入力しないという考えも最近が多くなっています。カナやローマ字は、昔は、目録カードの配列という問題に関わってきましたが、最近は、コンピュータで管理されため、配列問題は、あまり問われなくなってきています。また、リストの作成もあまりされなくなってきているので、読みがなくても、あまり困ることはありません。さて、ここに 吉祥寺 というタイトルの本があったとします。どのような ローマ字読みをつけるべきなのでしょうか。
大きく 2つのやり方 訓令式(国会図書館が採用)、ヘボン式が使われます。まず、大きく2種類に分かれることになります。ここで、コンピュータ上のローマ字の悲劇が登場します。ジョウ という音は 長音の音なので、長音記号をつける必要があります。通常は O の上に横棒がつきます。 さて、これを入れる方法がありません。うーん。悲しい悲劇がそこに存在します。
でも、考えみてください。フランス語にも、アクサンがあったり、ドイツ語にはウムラウトがありますが、フランスではフランス語がドイツではドイツ語が使えます。では、なぜ、日本語ローマ字の長音記号が、コンピュータ上にないのでしょうか。
実は、アルファベットとカナの共存という時代に、ローマ字の長音なんて問題が入り込む余裕がなかった。この時代には、アルファベットの小文字すら、捨てられていたのだから。(古い人しかわからないことを書いていますね。ごめんなさい。)さて、地下鉄やJRの駅に表示される 東京や吉祥寺の表記の長音がついているほうが、日本語ローマ字表記で、長音のないのは、英語表示です。英語には、アクサンやウムラウト、長音記号がありませんから。それでは、アメリカの図書館目録で、東京は、どのように表示しているのでしょうか。ちゃんと、長音表記していますよ。
それでは、アメリカ議会図書館の目録の例をみてみましょう。

DATABASE: Library of Congress Online Catalog

Tsumiki no toshi Tッokyッo : furenzoku na machi no shッuseki / Tamura
Akira...
LC Control Number: 98457969
Type of Material: Text (Book, Microform, Electronic, etc.) Brief Description: Tsumiki no toshi Tッokyッo : furenzoku na machi no shッuseki / Tamura Akira kanshッu ; Mizushima Takaji, Himaki Mitsugu hen.
Tッokyッo : Toshi Shuppan, 1997. 454 p. : ill., maps ; 20 cm.
CALL NUMBER: HT169.J32 T679 1997 Japan ------------------------------------------------
なにやら、いろいろなデータがならんでいますが、Tッokyッo なんてへんてこな文字が出てきます。実は、長音符号がついているのでこんな表示になってしまうんです。海外では、ちゃんと、日本語をどのように表記するのか決まっていて、これを手がかりに検索するので、本当は、日本の図書データに、統一された日本語ローマ字が書かれていることは意味あることなんですけど、日本ではあまり気にしていないのが現状です。
さて、クイズです。夏目漱石の坊ちゃんというタイトルは、ローマ字(ヘボン式、アメリカ議会図書館式)では、どう書くかわりますか?ここで、応えを書くわけにはいかないので、コメント欄をみてください。
そうか、アメリカ議会図書館のリンク先を書いておく必要がありましたね。


http://catalog.loc.gov/
AD
 |  リブログ(0)

テーマ:
当用漢字(常用漢字)は、その基本的な発想は、日常使う漢字を最小限にするという意図がある。戦後約2000字が選定され、ゆくゆくは、もっと減らして行こうとしていた。
1980年のコンピュータは、表現できる漢字も限られていた(第2水準までで、7000字程度)だったため、図書館の世界ではいろいろ工夫された。
たとえば、新漢字と旧漢字があったばあいは、新漢字をつかう。そうすると、芥川龍之介は、芥川竜之介となる。そのため、国会図書館のコンピュータ目録を引くと、芥川龍之介と竜之介の2つが混在している。(1998年以前は、竜之介に統一されていた)もちろん、同じ理由で、村上龍は、村上竜になっている。
この原理は、JIS水準で拾い込めない漢字(その多くは難しい旧漢字)を、新漢字で置き換えることによって、収録範囲を拡大できるということになる。
このことは、限られたコンピュータ漢字の世界をすこしでも拡大したいという現実的な方法であった。
----------------
もちろん、JIS第2水準 7000字でも、漢字は足りないのだから、常用漢字2000字で日常を表現することことは、なかなか難しいのだが、新聞、放送などは、この2000字枠を、しっかり守っている。
その代表的な漢字は、”経営破たん” 破綻の”綻”字は、常用漢字以外なので、新聞、マスコミなどで使用することができない。
----------------
日本は、日本語をどうしようとしているのか、明確な方針を出すべきなのかもしれない。いや、既に常用漢字などの整備によって、その方針はあきらかなのかもしれないが。いろいろ気がかりですね。

最初制定年 最終更新年
教育漢字 1006字 小学校で覚える漢字 1858年 1989年
当用漢字 1850字 新聞、マスコミ等で用いる漢字 1946年 1946年
常用漢字 1945字 当用漢字表の改定 1981年
JIS第1,2水準 6879字 JIS X 0208-1990
JIS補助漢字 5801字 JIS X 0212-1990
Unicode 34168字 世界各国の文字 1995年 JIS X 0221-1995 
http://subsite.icu.ac.jp/people/kimito/kimito-o5.htm
 |  リブログ(0)

テーマ:
日本語は、どれが、基準なのでしょうか。 ”ひらがな”と”カタカナ”は同じ要素で成り立っていると思いますか?実は、けっこう違うんです。(以下の例は、図書館目録規則によるので、一般的な話とは、すこしことなる点があります。)わたしは、がっこうへいきます を カタカナ表記するとワタシワ、ガッコウエイキマス という感じになります。は、へ、づ といった、ひらがなで表示されるものが、カタカナでは、音を表現する立場から、ワ、エ、ズ に置き換えわれてしまいます。 http://subsite.icu.ac.jp/people/kimito/kimito-o2.htm

http://www.ndl.go.jp/jp/library/data/kanahyouki.html


さて、ローマ字の問題はもっと、複雑です。通常、日本で使用しているコンピュータは、日本語ローマ字表記ができないのです。実際、東京をどのように日本語ローマ字表記しているのか、東京駅や地下鉄で観察してみましょう。日本のコンピュータで、長音表記をどのようにするのかちゃんと整備しなったのです。ここに、日本語ローマ字の悲劇があります。訓令、ヘボン式をはじめ、現在、コンピュータ文字入力用に、ジャストシステム、マイクロソフトはじめ、たくさんの文字入力のためのローマ字方式が登場しています。このバライティ豊なローマ字の出現にも、誰も、整備することはなく、教育の世界では、訓令式、外務省は、ヘボン式 道路や地下鉄、鉄道の表示は、なに式でしょうか(外国人のための要素が多いので、ヘボン式でしょうか?)最近、もっとやっかいの問題が登場しています。ローマ字は、日本語の音を表現する(ひらがなやカタカナも同様ですが)ために文字列票を整備してきますが、いままで、日本語にない音が、英語などの外国の関係で、たくさん日本でも使われるようになっているきているため、ローマ字の新しい、文字列表を拡張すべきと考えている人もいます。現在は、英語などの西洋の言語の影響を受けていますが、今後、アラブ言語、アフリカなどの言語の影響をうけると、日本で使われる 音 がますます増加していく傾向にあります。その新たしい 音 をどのように表記していくのか、日本語の 音 拡張の問題が発生しています。すこし前ですが、アメリカ大統領を リーガン と表記すべきか レーガン と表記すべきが問題になりました。 9.11の首謀者とされる オサマビーンラーディン氏の表記は、日本のメディアご毎に異なっているのを、ご存知ですか、日常見かけるだけで、4通りはあります。図書館システムが格闘しなければならないのは、漢字の種類の問題だけではありません。この日本語特有な 表記の問題がたくさんあります。昨年の大河ドラマで、新選組 というのがありましたが、あれば、新撰組 だと考える人もたくさんいます。(この問題は、旧漢字、寝漢字の問題ではないのでちょっとやっかいです。)そうそう、新漢字、旧漢字の問題もやっかいです。私の名前 黒澤ですが、黒沢と長く使っていました。 小さい頃から 黒沢 を使いつづけていたので、そうするものだと思っていましたが、結婚して、妻から 戸籍にある漢字を使いなさいという指摘を受けたので、黒澤を使うようになりましたが、いったい、どれがただしんでしょうか。こまりましたね。これこそ、日本語の楽しみ なのかもしれませんが、コンピュータには、大混乱の元凶です。その元凶と一番よく格闘してうまくやっているのが、  Google なのかもしれません。なかなか、うまく検索できるように工夫されていますね。きりがないので、この辺で終わりします。次からは、もうすこし、分割して読みやすくしなくてはなりませんね。
 |  リブログ(0)

テーマ:
1960年代のコンピュータは、計算しかないものだったように思う。それを、ビジネスマシンと捉えたところが、IBMのすごさであった。英語の世界では、アルファベットと数字で、ほとんど、必要な業務がこなせるため、非常に早くから、業務のコンピュータ化がすすんだが、日本では日本語という問題があった。1970年代、日本で稼動していたコンピュータは、数字、アルファベット大文字のみ、そして、カタカナという組み合わせで、業務の機械化をしようとしていた。日本では、いろいろな日常使う漢字(常用漢字)を2000字程度に限定しているが、日本語全体をカバーするとなると、何万字も必要になる、(トロンでは、13万字を確保している。)しかし、まず、8ビット(256文字の世界を乗り越えないと、漢字の世界に入れない。
8ビットが、16ビットへ、そして、32ビット、64ビットと、ビット数が増えるにしたがって、利用できる文字数は、飛躍的に拡大した。
しかし、コンピュータ環境(日本語の文字コードの多様さ、世界の文字コードとの調整、ユニコードの整備など、いろいろな問題が現在も山積みである。)の整備など、まだまだ、課題が多い。
図書館システムの発展は、まだまだ、続くのである。
今後の50年は、どうなるのであろうか。
-----------------------------------------------------------------
インターネットが普及し始める時点(1990年代前半)は、図書館の目録データは、インターネット世界で、もっとも、有効なデータベースであると考えられていたが、現在、さまざまなデータ(画像なども含めて)が登場すると、図書館の目録データが、インターネット世界でもっとも、つまらないデータベースの一つになってしまったように思われる。
-----------------------------------------------------------------
この目録、分類、記述という問題を継承しながら図書館システムは、どのように進化していくべきなのであろうか。
 |  リブログ(0)

テーマ:
図書館で自動化書庫が最初に利用されたのはアメリカで1990年にさかのぼることができる。しかし、その後、なかなか普及しなかったが、2000年になると日本でも急速に普及しはじめ、2005年現在、その数が20近くになり、現在、新図書館を建設するところの多くは、自動化書庫の導入を検討している。一度、自動化書庫を導入したら、図書館システムのように、簡単に入れ替えることはできない。基本的には、建物と同じ寿命だけ使われることになる。
たぶん、一度入れたら、30年、40年使うことになる。
そして、現在、自動化書庫の黎明期であり、自動化書庫をどのようにつかうのかという”文化”の確立のときである。
よろしく。
http://subsite.icu.ac.jp/people/kimito/libmh04.html
 |  リブログ(0)

テーマ:
図書館は、人類の歴史とありました。その図書を管理するために、いろいろな方法が考えられてきました。
図書館の管理をコンピュータで行うことを夢みて、1960年ごろから、いろいろ実験が繰り返されて、現在にいたりました。この50年の変化はたいへんなものでした。今後どんな図書館システム、インターネットを含めて、どのようになっていこうとしているのか興味津津です。そこで、図書館システムの今後の50年を考えるというコーナーを作りました。よろしく。http://subsite.icu.ac.jp/people/kimito/
 |  リブログ(0)

AD

Ameba人気のブログ

Amebaトピックス

    PR

    ブログをはじめる

    たくさんの芸能人・有名人が
    書いているAmebaブログを
    無料で簡単にはじめることができます。

    公式トップブロガーへ応募

    多くの方にご紹介したいブログを
    執筆する方を「公式トップブロガー」
    として認定しております。

    芸能人・有名人ブログを開設

    Amebaブログでは、芸能人・有名人ブログを
    ご希望される著名人の方/事務所様を
    随時募集しております。