黒澤公人のドキュメンテーションシステムの100年(1960年-2060年)

一次情報ダイレクトアクセス時代のドキュメンテーションシステム


テーマ:
著作物のアーカイブ事業と意思表示システムについて議論、文化審議会小委

----------------------
海外のデジタル化の動向を報告
日本語OCRの精度の問題も指摘

---------------------
感想

日本での最大の問題
著作権問題の前に、日本では、大きな技術力がありながら、そのデジタル化技術の大きなおくれを取っている。
その遅れも、並大抵の遅れではない。

ある面、日本語のデジタル化技術は、Amazon,Googleの技術に依存するほかはないのではないか。
ほとんどの技術を押さえ込まれているのではないか。

図書を傷めず高速スキャンする技術。
日本には、優れたスキャナーの技術があるのに、図書にまったく生かされていない。

OCR技術は、単に活字を判別するだけでないだろう。
ノイズ除去、文法解析、エラーの自動修正、内容分析
単語位置検出

非常に複雑な技術が必要で、それは、必須な技術であるにもかかわらず、
それに手を付けずにいることが、最大の問題だ。

図書のデジタル化は、非常に高度な技術であるが、日本で、まったく手付かずであり、
多くの技術が、海外の会社の押さえ込まれているのではないかと、危惧する。

もっと、国家レベルで、技術導入ををして、一つの産業基盤を作成すべきだ。


AD
 |  リブログ(0)

テーマ:

第2回 Amazon WebAPIを使ってみる  

 Web 2.0の技術を使って,実際にアプリケーションを作ってみましょう。まず1つめは,AmazonのWebサービスを使った蔵書管理サイトです。Ruby on Railsを使って,Amazonから書籍データをAjax通信で取得し,Webブラウザで一覧できるようにします。


 

 

Web2.0サイトを自作する - 目次

 |  リブログ(0)

テーマ:
現在、新しい図書が、7万タイトル以上出版される。
1年は365日しかないので、全国で、200冊の図書か出版されている。
(雑誌や、漫画、参考書を含まないので、それらを含むともっとたいへんなことになる。)
以下 図書の話。
年間7万タイトルが出版されるが、本の冊数になると7億冊になるという。
図書を仮に1冊1センチとしても、7億センチメートル。 7000キロメートル。 
本を1冊1キロとすると 7億キログラム 70万トン (ウルトラマン一人分?)

その大量の図書が、日本の国土の上に積み重ねられている。
100年以上にわたり、積み重ねられた量は、何千万トンになる。
それを積み上げたら、日本の国土が、もっと、大きくなるかもしれないが。

この膨大な図書の量の中で、新刊図書は、わずかな部分しか占めることができない。
薬や食料品は、有効期限や賞味期限があるので、どんなに生産されても、市場に滞留することができないため、
その新鮮な薬や食料品は、市場の中で大きな位置をしめる。

しかし、新刊図書の価値は、いままで出版した図書が大量に溢れている中に、次々と投入される。
新刊図書は商品であり、販売されるべきものである。
しかし、新刊図書は、最後まで、ひも付き商品で、商品としての自由さがなく、最後は、戻ってくる必要がある。
再販商品である。

一度、販売されて図書は、新たな自由な市場を形成する。
完全に分離した商品として、販売が可能になる。
かつては、小さな市場であったが、現在、非常に大きな流通形態をたどっている。

世の中は、常に需要と供給の相関関係の中で経済が行われるので、重要に対して
供給が整備されていくと、儲けは小さくなく、経済は、均衡の方向に進む。
初めは、需要の大きさに、大きな儲けが可能になったものが、だんだん儲けが小さくなり
需要に対して供給過剰になると、市場の暴落が発生する。
そのための微妙なバランスが必要だが、すでに、新刊図書の需要を掘りこすことはできない。
もし、掘り起こしてしまうと、一時の儲け以上に、不良在庫とリサイクル品の山になり、
大きな問題が発生することになる。
このリスクを回避する方法が、返品だが、それも、コストが発生する。
優良商品には、返品しないという方法もあるが、それが、結構命取りになることも多い。

現在の日本で図書はどのように動いているのか。

たとえば、新刊7億冊が市場にでるというなら、まず、この一瞬をとめて考えてみよう。

たとえば、現在、日本で売られている図書数は 仮に20億冊としよう。
その内 現在の書店上にある図書  5億冊   1万店舗 5万冊 である。 なかなか厳しい数字である。
残り   古本                5億冊 1万店舗 5万冊
残り   出版社、倉庫、印刷所   10億冊
で、なんとか数字があってきたが、上記の数字に根拠はない。







 |  リブログ(0)

テーマ:
雑誌のオンライン書店の行方は、雑誌のBackナンバーをどれだけキープできるかによる。
雑誌のデジタル化で、オンデマンド出版ができるようになれば、きっと、大化けするかもしれない。
大量の雑誌のデジタル化をすべきであろう。
当面は、1冊1ファイルや1冊ごとの販売で問題ないだろう。
単価が安いと侮ってはならない。
基本料金、送料を織り込めば、他にない情報のサービスが確立する。

問題は、出版社がデジタル化やオンデマンドを許すかである。
どうも、そこを解決すれば、すばらしい可能性がありそうである。

大宅壮一文庫や国会図書館のように保存に悩むことなく雑誌記事サービスが可能になる。
雑誌はほどんど、保存されないので、累積データがたまれば、よい商売になるが、
商売になるまでの十分な量を蓄えるまで、それをやり遂げられるかが、問題である。
他を圧倒するパワーをことである。

たとえば、デジタル化で、大宅壮一や国会図書館、日外アソシエーツを連携する方法もあるだろう。
アマゾンと組む方法もある。
国会図書館がデジタル化すればよいのだが。


Google Scholar が、驚異的なデータ量を誇っている。
週刊誌などもやれるといいのだが。

 |  リブログ(0)

AD

Ameba人気のブログ

ジャンル人気記事ランキング 教育ジャンル

Amebaトピックス

    PR

    ブログをはじめる

    たくさんの芸能人・有名人が
    書いているAmebaブログを
    無料で簡単にはじめることができます。

    公式トップブロガーへ応募

    多くの方にご紹介したいブログを
    執筆する方を「公式トップブロガー」
    として認定しております。

    芸能人・有名人ブログを開設

    Amebaブログでは、芸能人・有名人ブログを
    ご希望される著名人の方/事務所様を
    随時募集しております。