dmoz エディタ日記 - ODP (Open Directory Project) 日本語階層 -4ページ目

dmozサーバ ダウン中

dmozサーバがダウンしています。
お手数ですがサイトの申請等は日をあけて、再度お願いします
フォーラムは稼働しています。エディタの方はそちらへどうぞ。

トラックバックスパム

この2週間ばかり、ものすごい量のトラックバックスパムがあり、消去するのも疲れたのでしばらくトラックバックを受け付けないことにしました。
もともと多くトラックバックがつくblogではありませんので大勢に影響はないと思いますが。

自分だけのリンク集

このウェブログを始めた初期の頃にywadさんがディレクトリは死んだか という投稿をしています。
もちろん、ywadさんや私をはじめとするODPのアクティブエディタはディレクトリの存在意義を認めているからこそ、活動を続けているわけですが。
Yahoo!の検索結果にYahoo!ディレクトリの結果が直接反映されなくなったとことがそう言った論調に拍車をかけています。
先の投稿でywadさんは「ディレクトリは死にやすい」とも言ってます。
私たちは日々、消えているサイトを目の当たりにしています。現に日本語階層にはリンクチェッカーrobozilla が出動し、リンク切れのサイトを未審査に上げる作業をしていったばかりです。
メンテナンスの行われていないリンク集はとても悲しい。
だから「エディタになるべき人」 で自分だけのリンク集(もちろん自動登録でなくテーマを絞ったユニークなもの)を持っている人はそのリンク集をODPで作ってはどうかとも書いています。
ODPで網羅的なかつメンテナンスされたリンク集を作ることは本人にとって有益であるだけでなく、その分野に関心のある人にとっても非常に有益です。
それこそロボット型の検索エンジンでは挙がってこないサイトの蒐集と分類が可能なのです。

私は調べ物をしたとき、芋づるで挙がってきたサイトを追加してカテゴリを充実させることがあります。
小さな限られた範囲でサイトを網羅するのはそれほど難しいことではありませんし、調べ物をするときに非常に有効。
一石二鳥というわけで、私の個人的な関心で充実させたカテゴリが他の人の役に立てばこんな嬉しいことはありません。


ただし、その分類方法はODPの分類の基本的な考え方と一致していることが重要になってきます。
リンク集を作りたい人の切り口とODPの切り口とが必ずしも一致しないことがあります。

例えばキリスト教の教会。
キリスト教会は地域階層と社会/宗教・精神世界/キリスト教 以下の2か所に掲載することが出来ます。
地域階層では所在地の市町村に掲載するため「都道府県名/市町村別/市町村名/社会・文化」に掲載されます。
話題別階層では「教団・教派/教団名/教会/都道府県名」に分類されます。
これは地域階層ではあくまで“所在地”の情報を優先させ、その後に話題別(この場合は「社会・文化」)で分類する、
話題別階層では先ずトピカルに分類し(この場合は「教団・教派」での分類が優先される)、最後に都道府県分類となる。(「キリスト教/教会 」は教団・教派に分類できない単立の教会と@リンクの置き場です)
というODPの分類の原則は非常に重要だからです。
つまりODPの分類ではキリスト教会の都道府県別の一覧リストは作ることが出来ません。

ODPではこのように分類の大原則があります。分野によってはこの原則が窮屈に感じられるかもしれません。しかし、その窮屈さのデメリットを補足して有り余るメリットがこの原則にはあると考えています。

制約がゼロと言うわけではありませんが、ODPでリンク集を作り世界に向けてそれを公開する、これってちょっと楽しそうじゃありません?








同一サイトの重複掲載

8月ももう終わりだというのにまだまだ暑いですね。
メインに使用しているマシンが故障でこのところdmozの活動は最低限になっています。

前回のエントリーで日本語階層の掲載が14万サイトを超えたと書きましたが、実際には重複掲載が有るため14万種類のサイトが掲載されている訳ではありません。
重複掲載についてはガイドラインのこの部分 に書かれています。
最も一般的で、文句なしに出来るのは「地域」階層と他の話題別階層(アート、ビジネス、レクリエーション…)との2重掲載です。
地域性のあるものはたいていの場合、地域階層に掲載可です。
また、多言語のサイトも重複掲載可能です。10か国語で書かれていたら、10箇所で掲載されることが可能になります。
その他必要に応じて重複掲載されることが有ります。この場合はフォーラムで話し合いがもたれたりします。
ただ、ODPは重複掲載やディープリンクについて慎重な取り扱いをしていますので、ガイドラインにも書かれている通り、あくまで例外です。
我々が重複掲載も含めて○○サイト達成、なんて言うのはたとえ同一URLであっても一つ一つのサイトの掲載にエディタがそれぞれに関わり、それぞれに編集しているといったところからきているのです。
既に他のカテゴリに掲載されいるサイトは編集画面で見ると太字で示され、どこに掲載されているか確認できます。多言語のサイトの場合、日本語が本家のサイトなのに英語やフランス語でとっくの昔に掲載されていて、日本語が一番後だった、というときなど悔しい思いをします。


140.000 サイト

日本語階層の掲載サイト数が18日に14万を超えました。
13万サイトの時はここに書きそびれました。
12万達成 から8ヶ月半。
この間一日平均78サイトの計算になりますか。

次のキリの良い15万まで邁進いたしましょう。

言語階層の上位10
1 English 3060928
2 Deutsch 474996
3 Français 192011
4 Italiano 183714
5 Español 178429
6 Japanese 140123
7 Nederlands 94307
8 Polska 72937
9 Dansk 57062
10 Català 43851

地域/日本

お久しぶりです、yobesukeです。

地域階層の伸びについて以前にkaisezさんが書いてくれています
が、W/Jの掲載数14万を目前にして急激に伸びた地域がありますので、あらためて紹介したいと思います。
今回は今日の時点での掲載数も入れてみました。
北海道が急激に伸びています。
また、掲載数の少ない県はやたら400台が多いですがこれにはわけがあります。
地域階層及び「地域//日本」以上の編集権を持つエディタが掲載数の少ない県の最低をとりあえず400として底上げに努力した結果なのです。
何度も言うようですが自分に身近な地域のサイトを探してきて網羅するのは本当に楽しいものです。


1 東京 (5,142)
2 北海道 (4,222)
3 大阪 (2,712)
4 静岡 (2,432)
5 神奈川 (2,212)
6 愛知 (2,007)
7 千葉 (1,764)
8 埼玉 (1,588)
9 富山 (1,531)
10 福岡 (1,474)
11 兵庫 (1,446)
12 長崎 (1,346)
13 岡山 (1,215)
14 京都 (1,200)
15 長野 (1,187)
16 福島 (937)
17 広島 (913)
18 山梨 (733)
19 茨城 (728)
20 新潟 (705)
21 奈良 (597)
22 鹿児島 (543)
23 石川 (539)
24 宮城 (537)
25 群馬 (531)
26 沖縄 (470)
27 和歌山 (455)
28 栃木 (454)
29 熊本 (446)
30 福井 (444)
31 秋田 (442)
32 三重 (432)
33 鳥取 (428)
34 岩手 (423)
35 岐阜 (422)
36 大分 (422)
37 島根 (417)
38 香川 (416)
39 高知 (416)
40 宮崎 (413)
41 愛媛 (413)
42 徳島 (412)
43 滋賀 (406)
44 佐賀 (406)
45 青森 (405)
46 山形 (405)
47 山口 (403)

ODPニューズレター

ODPニューズレター2006春/夏号 が発行されました。

どちらかというと内向きな(エディタコミュニティを対象にした)内容ではありますが、URLは公開されていますし、ご覧頂ければディレクトリユーザにとっても興味深い記事ではないかと思います。

Quantity versus Quality
Many Roads Lead to Rome... の Tips For Setting Up Entry Pages and Portals の項など

日本語階層に関する記事がなぜ無いのかとお思いになるかもしれません。
はい、その分も今はサイト追加やディレクトリの拡充に取り組んでいますので・・・ ;-)

World/Japanese の掲載数はようやく、もうすぐ 14万件になります。

ODPマンスリーレポート(2006年5月)

ODPマンスリーレポート: ODP Monthly Report - May 2006 より

ディレクトリ全体
・ ディレクトリ掲載総数: 4,769,732
・ 一ヶ月間の増加数 -33,278 、増加率: -0.69 %
・ カテゴリ総数: 708,584

ODPデータの利用
・ NOODP - MSNサーチは春先から検索結果のスニペットにODPのサイト説明文を利用していますが、これを無効に 指定するタグ が用意されました。ODPのサイトタイトル・説明文は 編集ガイドライン にあるように、カテゴリパス名やキーワードを繰り返さないようにしています。

---
先月は Robozilla (dmozのリンクチェッカー)がやってきてリンク切れサイトを多数検出したので、ディレクトリの掲載サイト数は一時的に減少しました。
Robozillaとは
リンク・チェッカー Robozilla - Posted by ywad
Robozillaって誰? - エディタ用の資料

ODPマンスリーレポート(2006年4月)

ODPマンスリーレポート: ODP Monthly Report - April 2006 より

ディレクトリ全体
・ ディレクトリ掲載総数: 4,803,010
・ 一ヶ月間の増加数 24,200 、増加率: 0.51 %
・ カテゴリ総数: 706,571

多言語対応
・ 言語階層数: 78 ... http://dmoz.org/World
・ 準備中の言語: 99 ... http://dmoz.org/Test/World

エディタ
・ 活動中: 7,666
・ これまでのアカウント総数: 72,384
・ 新たに参加: 306
・ 活動を再開: 309
・ 活動を停止: 563

アクティビティ
Guidelines for Site Selection (サイト選択のガイドライン)が更新され、Spider Food, Lead Generators, Content Mills、といったサイトは掲載対象外と明示されました。また、サイトの信頼性についても criteria to consider when selecting sites(サイト選択の基準)に明記されました。 (注:日本語版ガイドラインは未更新)
・ search.dmoz.org や rdf.dmoz.org などのサーバが新しくなりました。

紹介されている内容の概略はこんなところでしょうか。仔細は原文をご参照下さい。

dmoz.jp

そういえば dmoz.jp というサイトがありますが、私たちとは一切関係ありませんので御注意下さい。

最近幾つか看過し難い点も見受けられるに至り、無関係の旨ここに明記することにしました。

ODPにおいて、各言語階層のエントリーページの類は正式には何も用意されていません。あるのは http://dmoz.org/World/Japanese/ 等のディレクトリの一ページだけです。
ODPエディタがそれぞれ Open Directory Project についての紹介等をしているサイトやウェブログは日本語階層に限らずありますが、それらはあくまでも各言語におけるエディタ有志による非公式な活動です。

ちなみに ODPデータの利用はODPライセンスに沿った範囲で自由です。
http://dmoz.org/World/Japanese/guidelines/copyright.html