将棋倶楽部24の名簿 からデータを得て、24のレイティングの妥当性を考察してみた。まず、各段級位毎の純ユーザ数、および100局以上の対局実績のあるユーザ数を調べた。100局以上としたのは、それくらいの対局数を最低こなせば、R値が真の値にほぼ収束すると思われるからだ。また、そのユーザ数をそのままグラフ化するとまともな図にならず問題があるので、100局以上のユーザ数÷R幅で正規化してみることにした。これは「段級位」のR幅が不均等なので、それを均等化するために行った。微妙な問題はあるが、「特別」は暫定的にR幅200とした。なお、本調査を行った日時は、'05年8月5日の7:00am頃である。
棋力 R範囲 R幅 ユーザ数 100局以上 正規化 構成率[%] 初心 - 49 50 11,999 50 1.000 0.0899 15級 50- 149 100 9,380 290 2.900 0.5219 14級 150- 249 100 8,540 2,817 28.170 5.0698 13級 250- 349 100 8,052 3,272 32.720 5.8887 12級 350- 449 100 8,097 3,265 32.650 5.8761 11級 450- 549 100 9,311 2,981 29.810 5.3649 10級 550- 649 100 28,957 3,510 35.100 6.3170 9級 650- 749 100 7,881 3,460 34.600 6.2270 8級 750- 849 100 8,158 3,359 33.590 6.0452 7級 850- 949 100 7,452 3,089 30.890 5.5593 6級 950-1049 100 6,379 2,681 26.810 4.8250 5級 1050-1149 100 9,389 2,991 29.910 5.3829 4級 1150-1249 100 5,982 2,716 27.160 4.8880 3級 1250-1349 100 7,251 2,742 27.420 4.9348 2級 1350-1449 100 5,377 2,411 24.110 4.3391 1級 1450-1549 100 5,327 2,107 21.070 3.7920 初段 1550-1699 150 8,745 3,288 21.920 5.9175 二段 1700-1899 200 6,813 3,675 18.375 6.6139 三段 1900-2099 200 5,495 2,938 14.690 5.2875 四段 2100-2299 200 4,151 2,064 10.320 3.7146 五段 2300-2449 150 2,586 1,019 6.793 1.8339 六段 2450-2799 350 987 805 2.300 1.4487 特別 2800- 200 36 34 0.170 0.0611 合計 176,345 55,564
左図が、その正規化した値を用いて作成したグラフである。本来なら正規分布曲線に近い形になる筈なのだが、大量に低い方にシフトしている。
対局数を考慮しない純ユーザ数を見れば、10級ユーザが突出しているが、これは恐らく初期登録時に「10級」で登録する者が極端に多いからだと思われる。次に多いのが「初心」や「初段」で、これも微妙に多過ぎる。特に目立つのは、「10級」や「初心」、「初段」の純ユーザ数が多い割に100局以上対局している者は少なく、また全体的に見れば1/3以下という事実である。
この不思議な偏りを説明する為に補助的な曲線を入れてみたものが左図だ。黒が本来の正規分布、赤が「初段登録集団」、青が「10級登録集団」、黄色が「初心登録集団」の予測した分布を意味する。100局以上対局しても、正当ではないサンプルが異常に多い為に、コロニーを形成して全体の分布に大きく影響しているのではないかと思われる。
これを見て思うのは、実力以上の段位で登録している者は少ないと言えば少ないが、逆に実力以下で登録する者が極めて多く、10級前後の級位は、むしろ激戦区になってしまっているということだ。実際に実力があれば対局をこなしていくうちにレイティングが上がっていく筈だが、大袈裟に言えば「初段の実力はあろうかというような10級前後のユーザ同士で星を潰しあって、なかなか上れない」という現象が起きているのではないかと推測できる。
さて、計算機将棋開発者が、自作のプログラムの棋力を測る為に将棋倶楽部24を利用していることは既によく知られていることで、そこでのR値が「事実上の標準」となりつつある。しかしながらそれはあまくまで「将棋倶楽部24での指標」と考えた方が良さそうだ。これをそのままFIDEのperformance ratingと等しく扱って(R値を)比較しても意味がないとはっきり言えそうである。例えば「カスパロフ級の棋力を持つユーザが、17.6万人の中に30名以上も居る」などというのは現実的とは言い難いからだ。