WIN5の結果には残り票数が公表されている。
この残り票数と前レースまでの残り票数から
勝ち馬のWIN5のオッズが計算できる。
このオッズを「WIN5オッズ」と定義する。
「WIN5オッズ」=前レースまでの残り票数/レース後の残り票数
そこで単勝オッズとWIN5オッズの関係を調べてみた。
5回分のデータをプロットすると、図1のようになる。
上のグラフのように単勝オッズが10倍を超えるあたりから
「WIN5オッズ」は単勝オッズの倍以上になったりする傾向が分かる。
つまり、単勝人気が無い馬には、
WIN5ではもっと人気がなくなるということだ。
そこでlog関数でプロットしてみた。図2
log(win5オッズ)とlog(単勝オッズ)の関係をグラフにした。
データの点があるていど直線に沿っていることが分かる。
そこで、統計ソフトRを使って単回帰分析で直線を推定する。
以下のプログラムで行う。
==================Rのプログラム=======================================
#csvがあるフォルダを指定 フォルダ名ユーザーが変更してください。
setwd("c:/Users/sakura/Documents/R")
#ファイル名を指定
filename<-c("win5.csv")
#odds win5 hyo1,nokori
#csvを読んでaに格納 header=Tはa1行目に項目名がある場合 sepは区切り記号
a<-read.table(filename,header=T,sep=",")
# plot(y軸データ~x軸データ,データ)
plot(win5~odds,a)
# 描画するウインドウを新しく作る
dev.new()
# plot(log(y軸データ)~log(x軸データ),データ)
plot(log(win5)~log(odds),a)
# 回帰分析を行う
result<-lm(log(win5)~log(odds),a)
# 推定回帰直線を描く
abline(result)
# 分析結果の要約
summary(result)
===================Rのプログラム終了====================================
そして結果が以下の通り。
-------------------Rの出力----------------------------------------------
Call:
lm(formula = log(win5) ~ log(odds), data = a)
Residuals:
Min 1Q Median 3Q Max
-0.46341 -0.08927 -0.05207 0.15553 0.56482
Coefficients:
Estimate Std. Error t value Pr(>|t|)
(Intercept) -0.53015 0.14064 -3.77 0.000995 ***
log(odds) 1.39966 0.06805 20.57 2.62e-16 ***
---
Signif. codes: 0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1 ‘ ’ 1
Residual standard error: 0.2457 on 23 degrees of freedom
Multiple R-squared: 0.9484, Adjusted R-squared: 0.9462
F-statistic: 423 on 1 and 23 DF, p-value: 2.624e-16
-------------------Rの出力終了-------------------------------------------
以上の結果から
WIN5過去5回のデータより
単勝オッズと「WIN5オッズ」の倍率の関係の回帰直線は
以下のようになります。
log(win5のodds)=log(odds)*1.39966-0.53015
単勝オッズから「WIN5オッズ」を推定して、
これをオッズと配当額の式に入力すれば
配当予測額が計算できる。
これでWIN5の
配当予測プログラムが作れそう。