オークスと日本ダービーが開催される東京芝2400mコース、内枠に入った馬は有利というのはわりと有名な話です。
はたして本当にそうなのか、まずは2010年以降に開催された東京芝2400mレースの枠順ごとの勝率、複勝率を見てみましょう。
枠順ごとの勝率(1着)
枠 | 頭数 | 1着 | 2着 以下 |
勝率 |
1 | 257 | 29 | 228 | 11.3% |
2 | 272 | 33 | 239 | 12.1% |
3 | 286 | 23 | 263 | 8.0% |
4 | 297 | 19 | 278 | 6.4% |
5 | 315 | 24 | 291 | 7.6% |
6 | 331 | 16 | 315 | 4.8% |
7 | 380 | 22 | 358 | 5.8% |
8 | 397 | 20 | 377 | 5.0% |
枠順ごとの複勝率(3着以内)
枠 | 頭数 | 3着 以内 |
4着 以下 |
勝率 |
1 | 257 | 65 | 192 | 25.3% |
2 | 272 | 76 | 196 | 27.9% |
3 | 286 | 60 | 226 | 21.0% |
4 | 297 | 57 | 240 | 19.2% |
5 | 315 | 80 | 235 | 25.4% |
6 | 331 | 66 | 265 | 19.9% |
7 | 380 | 82 | 298 | 21.6% |
8 | 397 | 70 | 327 | 17.6% |
たしかに1枠と2枠が勝率、複勝率ともに他の枠に比べ高い傾向があります。
しかしこの勝率、複勝率の高さだけから本当に内枠は有利と言い切ってしまってよいのでしょうか?
統計的に見てもこれは信用してもよいデータなのでしょうか?
内枠の着順が良いという結果が偶然に偏っただけなのかどうかを統計的に確かめる方法として、カイ二乗検定という手法があります。
カイ二乗検定の計算は足し算、引き算などの四則演算だけで出来る上に、Rというプログラミング言語を使用すれば、たった1行の命令を書くだけで行うことができます。
それでは先ほどの枠ごとの勝率(1着)の表のデータを使用して、内枠有利の結果が偶然の産物なのかどうかを確かめてみましょう。
一応命令について説明すると、まずchisq.testは カイ二乗検定を実行するという意味です。
続いてmatrix(c(数字の羅列 …))という記述がありますが、これは枠ごとの勝率(1着)の表のデータを「1枠の1着回数, 1枠の2着以下回数, 2枠の1着回数・・・8枠の2着以下回数」という形式で記述したものです。
ncol=2とbyrow=Tはmatrix内のデータが「1着回数」と「2着以下回数」の2列で出来ている表であることをRに教えていてます。
命令を実行すると以下のような文字列が表示されるかと思います。
X-squared = 23.196, df = 7, p-value = 0.001576
この中のp-valueの値に100を掛けた0.1576という数値が内枠の着順が良いのは偶然偏った結果である確率を示してます。
つまり内枠の着順が良かったという結果が偶然であった確率は約0.1576%ということになります。
逆に言えば約99.9%の確率で、内枠の着順が良いという結果には何かしらの必然性があるという意味になります。
さらに枠順ごとの複勝率(3着以内)のデータでもカイ二乗検定を行ってみましょう。
次のような結果になります。
命令
chisq.test(matrix(c(65, 192, 76, 196, 60, 226, 57, 240, 80, 235, 66, 265, 82, 298, 70, 327), ncol=2, byrow=T))
結果
X-squared = 16.175, df = 7, p-value = 0.02357
勝率のデータ同様に97%以上と高い確率で内枠有利という考え方は統計的に正しいという結果になりました。
では内枠は有利という結果が必然であるならば、その理由はいったい何なのでしょうか?
まず真っ先に思うのは、内枠のほうが好きな位置取りを選びやすいからでしょうか。
2010年以降の日本ダービーを見直してみましたが、内枠の先行馬が悠々と直進しているのに対して、大外枠の先行馬がラチに向かって慌てた勢いで斜めに走っていく姿を見るとやはり不利に感じます。
中段から攻める馬も内側が渋滞するせいで、第1コーナーから第2コーナーを外外と走らされて他の馬に比べて約20~30m以上余計に走らされるというのも不公平な話です。
しかしそれが理由だとしたら他の競馬場でも内枠はすべて有利という話になるはずです。
他に考えられるとすれば枠順抽選の際、強くて人気のある馬を意図的に内枠に集めているからでしょうか。
もしそうであれば勝率が高くなるのは必然ですが、さすがにこれは無いはずでしょうから、結局のところ自分には答えがわからず終いでした。
とはいえ、いずれにせよ「東京芝2400mコースの内枠有利」は統計的に見ても使える予想ファクターであるということがお分かりいただけたかと思います。