競馬予想プログラム(Python)NOA  初版の成果 | エド金融道 (息子が「めしが食える大人になる」編)

競馬予想プログラム(Python)NOA  初版の成果

もう、プログラミングに没頭です。

丁度、仕事が忙しくない時期なので、時間もとれて、進みます!

先週は、このプログラムの「肝」となる、人工知能の開発です。

人工知能と言っても、簡単な機械学習ですが・・・

 

この本に出会えたのが大きい。

 

 

「人工知能?」「機械学習」 何?ってレベルでしたが、一気に理解が深まりました。

この本は、かなり簡単です。1時間ほどで読み終わりました。プログラム言語、Pythonの事を少しわかっていれば、小学生高学年でも簡単に読めると思います。データ構造の理解が必要だから、2年生の方も読んだ方が理解が深まるかもしれません。

 

 

さて、この本を読んで、独自に作った指標で分析をしています。

青が1着になる馬、赤がそれ以外です。

ぱっとみて・・・どうですか?右上に固まっていますよね?

右下にある青の1点は、ノイズかな。機械学習は、このような、人間がぱっとみて、青の点は、右上の領域に固まるようなグループ分けの線を引く事ができます。少し赤は混ざりますが、それでもなんとなく、領域を作れますよね?私のレベルでは、まだ、うまく線が引けるプログラムまで到達できていませんが、手動で、なんとなく、青なのか、赤なのかをデータ分けができるようになりました。

 

そこで、昨日、日曜日のレース、お小遣い1万円をドカンと投資(笑

この予想プログラムは確率依存なので、出来る限り沢山の試行回数(レース数)が必要です。

100%当たる予想なんて不可能で、ある程度当たる予想の確率に期待値(オッズ)を掛け合わせて、結果としてプラス収益(回収率100%以上)を目指します。

 

まあ、1万なのでたいしたレース数購入できないので、確率モデルとしては、全く必要な試行回数は獲得できません。

でも、なんとなく予想ロジックができたので、気晴らしにやってみました!

 

【結果】

 

東京と小倉の16レースを買って、7レース的中。

東京のメイン11レースなんて・・・

3連複1点買いで、当たる!

 

まあ、たまたま、運が良かったのでしょう。

分析するには試行回数が足りていません。

でも、小倉9Rとか

万馬券を当てています。この買い目は、自分で考えるのであれば、絶対に買っていないと思います。

 

人工知能(機械学習)の長所は、こういう、人間が見落とすような事案を見つける事ができるところです。

そういうところでは、プログラムはちゃんと機能していそうです。

 

色々と理解が深まって分かって来たのですが、競馬の予想プログラムで収益を上げるには

①競馬の予想に必要な経験と知識

②プログラミングのスキル

③数学/データ解析面での研究的なスキル

④初期投資の自己資金

⑤税制面など法律リスクに対する理解

が必要です。特に③ですね。

今回、普通に大量のデータをAIに掛けたら、正解率78%とかのモデルが出来ました。

「これはすごい!」と思ったら・・・実は、AIは、すべての馬が3着以内に入らないと予想していました。

十数頭がレースに参加するので、全部の馬が3着以内に入らないと予想したら、確実に、4着以降の馬は「来ない」ので正解になり、そりゃ正解率78%とかになります。

原因は、モデルの学習用のデータ数が多くて、ノイズが沢山ありすぎたので、AIから見て、全部の馬が3着以内に来ないように見えたようです。だから、上で示したデータはあえて、100データとか少なくして、しかも、1着に来る馬を青と、目立つポイントだけを絞りました。

こういうAIに教え込むためのスキルは、研究とか経験した人でなければ難しいかもしれません。

 

学生時代7年ほど、化学反応とか、遺伝子制御のシミュレーション研究をして来たのが、まさか、ここで役に立つとは・・・

 

博士号もとって、海外論文にも投稿してきた研究経験は、サラリーマンの給与には全く役に立っていませんでしたが、「競馬」に役に立ちそうです(笑