ランキング その8 | とあるエンジニアの現実的妄想

ランキング その8

ということで。
ちと考察してみた。

まず、前提として、月初にはランキングがリセットされる。
つまり、通常は月初からの累計でランキングが決定するということだ。

恐らく、ランキングポイント(以下RPと略する)というものが存在して、そのポイントの多いほうから順番に1位、2位、とランク付けするのだろう。

RPの得点源としては、

 (a) 記事数
 (b) 訪問者数
 (c) 読者数
 (d) コメント数
 (e) トラックバック数
 (f) 読者になった数
 (g) トラックバックした数
 (h) コメントをつけた数
 (i) 誰かのページを読んだ数

などが考えられるが、(h)と(i)は、ログインしていなくても可能な行為なので、得点をカウントできない。

さて。このうち。
(c)読者数
はかなりポイントが重いだろう。根拠はないが(をぃ

で、だ。
記事数。
これも、以前の「ランキング その5」でも書いたように、これも結構重そうだ。

と考えていたのだが・・・イマイチ違うのか?
12/5の9記事投稿でランクダウン。ということは、記事の係数が低い、ということをあらわしているようにも考えられる。

だが・・・イマイチこれも違うような気がするんだよな。

ということで。
今のところ、私の感覚に一番合う仮説は「中央値説」

つまり、

 (a) 記事数
 (b) 訪問者数
 (c) 読者数
 (d) コメント数
 (e) トラックバック数
 (f) 読者になった数
 (g) トラックバックした数

この7つの項目にそれぞれ点数を付け、順番に並べ替えて中央にくる値。

(a)100点 (b)10点 (c) 20点 (d) 30点 (e)20点 (f) 25点 (g) 0点

このような配点だったとして、

 100>30>25>20>20>10>0

なので、20点をポイントとする、という考え方だ。
これだと、記事数だけ頑張っても、他が付いてこない場合にランクがダウンすることが説明できる。

同様に、異常値除去の平均値という考えもあって
最高得点と最低得点は異常値とみなして除き、それ以外を平均する。
上記配点だと、
100と0を除いて
 30+25+20+20+10=105
 105/5=21
となる。

処理的には、ソート必須の中央値の方が重そうだし、下の異常値除去の方が正解かもしれない。

まあ、どちらにしろ。
外から見えるのは、

 (a) 記事数
 (c) 読者数
 (d) コメント数
 (e) トラックバック数
 (f) 読者になった数

の5つで、しかも、読者数、読者になった数は、毎日チェックしていないと、いつ増えたかチェックできない。

これらの値の自己申告がないと、ちょっと、チェックはキツそうだな。