はじめに
今日はシルクの実績予測に関する少しマニアックな話になります。
数字とか好きな人にはめっちゃ刺さる話だと思いますが、結論だけ知れればいいという人にはあまり面白くない話だと思いますので、興味のある方だけどうぞ。
気づき
過去のシルクの実績額を見ると、必ずしも募集口数や抽優口数ときれいな相関にはなっていないことに気づきます。
まずはここ数年の応募総数順にソートした実績額を見てみましょう。
原因は?
しかし、一口馬主DBやnetkeibaの検討数との相関は応募総数が圧倒的に高いので、応募総数から、何とかより精度の高い実績額予測ができないかと考えます。
そこで、これらのデータから、明らかに同じぐらいの順位の他の馬よりも実績額が高かった馬をピックアップして傾向を探ります。
一部例外はありますが、5000万円以上のいわゆる高額馬が圧倒的に多いことが分かります。
一方、ここでは抜き出しはしませんが、同順位の馬に比べて実績額が少ない馬は価格の安い馬が多いことが分かります。
そこで、票数予測に募集価格の要素をうまいこと加えてやると、いい感じになりそうだということが分かります。
試行錯誤
現状、票数と実績額の相関は約0.89です。
まあまあの数値ですが、まあまあの数値なだけにここから上げていくのが難しいです。
そこで、票数予測に募集価格の要素を「うまいこと」加えてやれないか試すわけですが、これがなかなか難しいところです。
票数と募集価格というのはそれぞれ全く別の要素だけに、これらを機械的に組み合わせるとわけのわからないことになります。
とりあえず、票数と募集価格を単純に掛け算した数値との相関を試しますが、0.80とむしろ相関は下がってしまいました。募集価格の影響が強すぎて、票数を薄めすぎてしまっているようです。
そこで、募集価格の影響を下がるため、募集価格の二乗根、5乗根、10乗根を掛け合わせて相関を出してみると、それぞれ、0.94、0.95、0.93となりました。
どうやら、5乗根あたりがベストブレンドのようです。
改善結果
かなりいい感じです。
ということで、これからは、実績予想に、募集価格も加味して算出していこうと思います。
関連記事
コメントやいいねをいただけると非常に励みになりますので、お願いしますm(_ _)m