【データ競馬】3歳未勝利(1)~初出走馬~ | リゲイン総合研究所~競馬番組「表」なんて実在しない~

リゲイン総合研究所~競馬番組「表」なんて実在しない~

◆片岡勁太は実在しない「番組表」という虚像を読み解こうとするが我々は「競馬番組」の実体を解き析かす点で全く別物である。日本中央競馬会は、その名の下で施行される競馬番組の中で「何が勝っても構わないレース」の存在を許諾する事は皆無である。

 この記事は昨日、note用に作成したのだが、作表(画像)を付加しても編集時には表示される画像が投稿を済ますと表示されないので、こちらにマルチポストする。記事の文言は、ブログ掲載に伴う編集は行っていない。つまり、コピペ引用なので、意味不明の点などあるかもしれない。

 

 「データ競馬」というと下坂昇平いや、須田鷹雄あたりが有名だからJRA-VANが公式データをダイヤルQ2という課金システムを使い高額な通信料を獲得しながら天下り先として高度成長して来た「(旧)ターフメディアシステム(現JRAシステムサービス)」のルーツでもある。当研も、その犠牲者の1人で、1ヵ月10万円近くをNTTから引き落とされていた辛い思ひ出もある。
 バブル全盛の頃でもあり、宅建主任者(現在の取引士)の必要な数が増えたことから当研も、その流れに逆らえずに受験、合格、登録により、小遣い銭稼ぎの一役を担ったから払えたような気がする。
 それがインターネットの普及により、月2K足らずでデータ採り放題となったが、その状態のまま既に相当の期間が経過している。その間、TARGET-JVのフリーソフト化するなどで、JVデータの需要は落ち込む事を知らない。だから、名目上、2次利用の禁止を掲げているが、現状はかなり緩いものである。これが「損害賠償請求」に至ったことは無いはずだ。2次利用によって別に利権も発生している訳だが、これらは、我々が払わされ続けている高額な情報料に因るものである。
 最初から愚痴っぽくなってしまったが、そういう心持ちで記事は書かれている事をご理解頂きたい。

 

【データ競馬】3歳未勝利(1)~初出走馬~

 さて、どの分野から書き始めるかと考えながら、今の時期1日12レースの中で、もっともレース数の多いものを対象にしてみようと思い立った。作表は抑えると言いながら、まずは以下の表を示す。となってしまう。

 これは、タイトル通りのデータである。今年は既に昨年実績の20勝が挙がっているが、母数は304頭と、平均が600頭余りだから、充足率が5割程度である。これ以上「勝つ初勝利馬」が出ないのであれば、それはそれで人気でもぶった斬る根拠に成り得るが、それをデータは元より誰も保証などしてくれない。確率を駆使すれば、ある程度の信頼度を確保しながら、この先に出現する可能性は推量可能ではあるが話が難し過ぎて、ここでは馴染まない。
 3歳未勝利戦など、通常は不確定要素が多いので手を出せない人も多いだろうし、「見(ケン)も止む無し」の対象でもある。勝馬投票券の売上も、それを証左している。例えば、対象は「初出走馬」ばかりでは無いし、芝で凡走し、今回はダート戦での躍進を目論んでいる陣営もある。しかし、この個体がダート戦でどんな走りをするのかは判らないから、調教や血統などで推測される。父であるクロフネが二刀流だから、その産駒のダート替わりは狙いだとか、色々なセオリーもあるのだろうが、それらのデータでの検証は、その内という事で。そして、そんな記事がある程度、ストック出来れば、その段階での「有料化」を目論んでいる。
 当研が申し上げるここでのロジックは、確率に裏打ちされたある程度の信頼度を保持したものでは無い事をご承知置きください。まぁ、須田くんの話も同じようなものでしょうから、その辺はそんな感じで、そして最終的には貴方ご自身の責任で判断してください。
 上のデータの初見で気になった点を言うと、2、3着馬が少ない印象。しかし、2013年は、今の状態のまま今後出走する初出走馬らの殆どが馬券対象外になっても再現される。
 ああ、思い出した事を書くと、当研の確率論・出現率論の中では、Aという種別が、勝率が高いからAを狙うのではなく、逆にBの結果が通常より低いものが修正されると「平均修正法」を採用している。だから、Aを全部買い続けたら回収率が1を超えるだのという類は提案する事は無い。意外と長文になってしまうなぁ。この辺で切り上げる。その前に人気順別データも尾巻しておく。尚、項目は1着~5着、そして6着以下を集計しており、今後も、このパターンで統一し続ける予定。下表には右に1着率、2着率、3着率、その合計を提供している。