将棋倶楽部24の名簿 からデータを得て、24のレイティングの妥当性を考察してみた。まず、各段級位毎の純ユーザ数、および100局以上の対局実績のあるユーザ数を調べた。100局以上としたのは、それくらいの対局数を最低こなせば、R値が真の値にほぼ収束すると思われるからだ。また、そのユーザ数をそのままグラフ化するとまともな図にならず問題があるので、100局以上のユーザ数÷R幅で正規化してみることにした。これは「段級位」のR幅が不均等なので、それを均等化するために行った。微妙な問題はあるが、「特別」は暫定的にR幅200とした。なお、本調査を行った日時は、'05年8月5日の7:00am頃である。


棋力     R範囲    R幅 ユーザ数 100局以上    正規化  構成率[%]
初心      -  49      50   11,999        50     1.000  0.0899
15級    50- 149     100    9,380       290     2.900  0.5219
14級   150- 249     100    8,540     2,817    28.170  5.0698
13級   250- 349     100    8,052     3,272    32.720  5.8887
12級   350- 449     100    8,097     3,265    32.650  5.8761
11級   450- 549     100    9,311     2,981    29.810  5.3649
10級   550- 649     100   28,957     3,510    35.100  6.3170
9級   650- 749     100    7,881     3,460    34.600  6.2270
8級   750- 849     100    8,158     3,359    33.590  6.0452
7級   850- 949     100    7,452     3,089    30.890  5.5593
6級   950-1049     100    6,379     2,681    26.810  4.8250
5級  1050-1149     100    9,389     2,991    29.910  5.3829
4級  1150-1249     100    5,982     2,716    27.160  4.8880
3級  1250-1349     100    7,251     2,742    27.420  4.9348
2級  1350-1449     100    5,377     2,411    24.110  4.3391
1級  1450-1549     100    5,327     2,107    21.070  3.7920
初段  1550-1699     150    8,745     3,288    21.920  5.9175
二段  1700-1899     200    6,813     3,675    18.375  6.6139
三段  1900-2099     200    5,495     2,938    14.690  5.2875
四段  2100-2299     200    4,151     2,064    10.320  3.7146
五段  2300-2449     150    2,586     1,019     6.793  1.8339
六段  2450-2799     350      987       805     2.300  1.4487
特別  2800-         200       36        34     0.170  0.0611
                   合計  176,345    55,564

左図が、その正規化した値を用いて作成したグラフである。本来なら正規分布曲線に近い形になる筈なのだが、大量に低い方にシフトしている。

対局数を考慮しない純ユーザ数を見れば、10級ユーザが突出しているが、これは恐らく初期登録時に「10級」で登録する者が極端に多いからだと思われる。次に多いのが「初心」や「初段」で、これも微妙に多過ぎる。特に目立つのは、「10級」や「初心」、「初段」の純ユーザ数が多い割に100局以上対局している者は少なく、また全体的に見れば1/3以下という事実である。


この不思議な偏りを説明する為に補助的な曲線を入れてみたものが左図だ。黒が本来の正規分布、赤が「初段登録集団」、青が「10級登録集団」、黄色が「初心登録集団」の予測した分布を意味する。100局以上対局しても、正当ではないサンプルが異常に多い為に、コロニーを形成して全体の分布に大きく影響しているのではないかと思われる。

これを見て思うのは、実力以上の段位で登録している者は少ないと言えば少ないが、逆に実力以下で登録する者が極めて多く、10級前後の級位は、むしろ激戦区になってしまっているということだ。実際に実力があれば対局をこなしていくうちにレイティングが上がっていく筈だが、大袈裟に言えば「初段の実力はあろうかというような10級前後のユーザ同士で星を潰しあって、なかなか上れない」という現象が起きているのではないかと推測できる。


さて、計算機将棋開発者が、自作のプログラムの棋力を測る為に将棋倶楽部24を利用していることは既によく知られていることで、そこでのR値が「事実上の標準」となりつつある。しかしながらそれはあまくまで「将棋倶楽部24での指標」と考えた方が良さそうだ。これをそのままFIDEのperformance ratingと等しく扱って(R値を)比較しても意味がないとはっきり言えそうである。例えば「カスパロフ級の棋力を持つユーザが、17.6万人の中に30名以上も居る」などというのは現実的とは言い難いからだ。