//////////////////////////////

※2023年7月8日 本記事の内容を以下で再検証しており、その結果本記事の分析手法には問題があるという結論を得ています。

//////////////////////////////

 

 

将棋倶楽部24は、デフレが年々進行しているのではないか?という説がある。本記事ではこの説を、統計分析に基づいて検証する。

 

1.留意事項

本記事は統計学の知識が特別ある訳でもない馬鹿(三流大学卒学歴コンプ持ち)が書いているので、ここに書かれていることが誤っていても責任は取りません。ただ、馬鹿なりに正しい理論に基づいて書くよう、最善は尽くしました。そのことを踏まえ、信じるか信じないかは各自の判断に委ねます。

 

2.使用するデータ

以下のブログに掲載された、将棋倶楽部24ユーザーの2001年時レートおよび2019年時レート(n=50)を用いる。なお、サンプルの対象となっているのは、2001年時に初段~四段だったプレイヤーである。

 

具体的にこのデータは、以下のようになっている。

 

2.分析方法

2001年時レートと2019年時レートでは、対応がある(すなわち、2001年時レートが高い人は、2019年時もレートが高い傾向がある)と考えられる。そのため、対応のあるt検定を用いて、上記表のR差が、統計的に有意かどうかを検定する。

 

3.分析結果

検定統計量t=-2.368

p-value(左側検定)=0.01112

 

p-valueがほぼ1パーセント水準であるほど小さいため、H0を棄却し、H1を採択する。

よってR差の母平均は、0未満である(すなわち2019年のほうが、2001年時に初段~四段だったプレイヤーの平均レートは下がっている)と推定されるため、2001年時に初段~四段だったプレイヤーの間ではデフレが進行していると、本記事では結論付ける。

 

4.課題

本記事では、24のデフレ節に対し、一定の統計的根拠を与えることができた。その一方で、以下のような課題が残る。

 

①t検定の妥当性

t検定を行う際には、標本平均が正規分布していることが必要となる。また、標本平均は中心極限定理より、それぞれのサンプルが独立同分布(i.i.d)で、サンプル数がある程度大きければ正規分布に近似できることが知られている。

しかし今回の場合、サンプル数はある程度大きいのでいいとしても、独立かどうかは怪しい。

したがって、標本平均が正規分布している保証もなく、これを検証する術が本記事では示せていない。

標本平均が正規分布しているかを検証するには、よりサンプル数を確保したうえで、その中から無作為抽出により標本平均をいくつか生成するような方法で、分布の形を検証する必要があるだろう。

 

②他の棋力帯においてはどうか?

本記事ではデータの都合上、初段~四段の棋力帯における検証に留まった。したがって本記事での結論が、他の棋力帯(高段とか級タブとか)でも当てはまる保証はなく、今後の研究課題である。