2005/1 ランキングデータ集計プロジェクト 草案 | とあるエンジニアの現実的妄想

2005/1 ランキングデータ集計プロジェクト 草案

1.目的
このプロジェクトは、ランキングのデータを集計し、その複雑なランキングデータの計算方法を推定することを目的とする。

2.注意事項
このプロジェクトで得られるだろうデータは正確なものであることが保証できない。善意の1万のデータは、悪意のある10のデータの混入で不正確なデータの集まりに成り果ててしまう。
だが。このプロジェクトは、善意の参加者のみで構成されると信じ、全てのデータが正しいことを前提に算出する。

3.集計データ
集計単位は日毎とし、2005/1/1から2005/1/31までのデータを集計する。
集計するデータは以下の9項目とする。

 (a) 記事数
 (b) 訪問者数
 (c) 読者数
 (d) コメント数
 (e) トラックバック数
 (f) 読者になった数
 (g) 総合ランキング
 (h) ジャンルランキング
 (i) トラックバックランキング

#アメブロを始めて日が浅い人にはランキングの補正があるのではないか、という意見もあったため、アメブロ暦も集めるべきかもしれない。

4.データフォーマット
2005/1 ランキングデータ集計プロジェクト で使用するデータフォーマットは以下のとおりとする。このフォーマットは、自動収集プログラムによる集計が容易なように、発表する人間の手間を度外視し、プログラムが読みやすいフォーマットとした。

@@ 2005/1 Ranking Data Format @@
(a), (b), (c), (d), (e), (f), (g), (h), (i)

5.データフォーマット実例
以下に、データフォーマットの実例を示す。
2005/1/1のデータが

 (a) 記事数 2
 (b) 訪問者数 30
 (c) 読者数 5
 (d) コメント数 3
 (e) トラックバック数 2
 (f) 読者になった数 0
 (g) 総合ランキング 1200
 (h) ジャンルランキング 300
 (i) トラックバックランキング 400

の場合、以下のような形式となる。

@@ 2005/1 Ranking Data Format @@
2005/1/1, 2, 30, 5, 3, 2, 0, 1200, 300, 400

6.調査方法
上記ランキングデータの調べ方に関しては、別途データ調査手順書を作成する。

以上、たたき台。
何か良い案、改善案があれば、コメントいただけると幸い。
改善案を取り入れて、土日で本案を書き上げる予定だ。

--ryuuri/りゅうり/流離