傾向を発見することと、仮説を検証すること
統計を使って傾向を発見することだけが分析だと思っていませんか?競馬の場合、統計を使って発見された傾向なんてほとんど間違いです。自ら考えた理論を検証する道具として統計を正しく使ってこそ、正しい傾向を発見できるのです。
因果関係という言葉がどうもしっくり来ていない方が結構いるようなので、その基本にある統計の使い方について説明してみます。
1.仮説をたてる
2.それを示すデータを元に、仮説が(正しい事を)検証する
統計は2.を手伝うためのツールです。(間違っている事を検証することが得てして多いのですが)つまり、1.の仮説無くして2.の検証をすることはできないのです。ただ、何も無いところから仮説をたてるのが厳しい場合に、次の方法が使われます。
0.データの傾向から、仮説を考える
最近もてはやされているデータマイニングは、まさに0.を実現するための方法です。ただし、0.だけでは何の意味も成さないのです。
例えば、POSデータなどをデータマイニングすることによって「雨の日は冷凍食品の売上が多い」という相関関係が出たとします。この相関関係を「分析結果」だと思う人がいますが、それは間違いです。例えばこれだけの情報で「雨の日に沢山冷凍食品を仕入れておけばいい」と判断してしまうと、間違いを招くことがあります。
この場合、2つのミスを犯す可能性があります。
一つ目は、因果関係を間違えるミスです。雨の日は実は顧客が少ない事を見越して店員がセール価格を出しているが故に冷凍食品がよく売れているのかもしれません。これは、雨の日が原因で、冷凍食品が売れるというのが結果だと単純に考えてしまった事によるミスです。
二つ目は、分析を見逃すミスです。実は雨の日が続いていたという事実を見逃し、その為に買い物を減らそうとした人達が冷凍食品を購入していたとすれば、単に一日だけ雨の日があっても売上は増えませんので、明日の天気予報だけを見て仕入れを増やすと失敗が起こります。
それでは、ミスをしない為には何が必要なのでしょうか。それが「因果関係の説明」になります。具体的には、なぜ雨の日に冷凍食品が売れるのか、その理由を「統計を使わずに」説明することです。それがしっかり説明できれば、いよいよ検証になります。例えばそれは、他の地域でも雨の日に冷凍食品が売れているかであったり、先月だけではなく他の月もそうであるのかを調べることであったりします。
競馬の場合、0.で傾向を発見しただけで小躍りしてそれをさも「分析結果だ」と思う人がとても多い。大事なのはその発見された傾向は「どういう理由でそうなったのか」を考える事です。その理由が原因と結果を結びつける理由であり、その理由が納得できるように説明できてはじめて「因果関係がある」と言えるのです。
因果関係の無い傾向を発見しても、それはそうなる理由が無い故に「たまたま」であり、継続的にその傾向が発生する保証はありません。よってその傾向を予想に使っても、次にそれがまた発生するとも言えないのです。つまり、当たらない予想となるわけです。
競馬で発見できる傾向は星の数程ありますが、明確に説明できる因果関係はそれほどありません。そういった状況の中でたったいくつかの傾向を発見したとしても、因果関係をしっかり説明できるものは少なく、さらにそれが競馬の結果に重要な要因と成りうるものになることはごくごくまれです。
それでも、それを探るのが競馬の予想の楽しみでもあるわけですけどね。
そこで前回の内容を考えてみましょう。武豊の勝率がだんだん下がってきて、連対率が落ちてきていること。サンデーの血統の濃い馬がだんだん減ってきていること。この2つの相関からあてずっぽうで考えられたものだったとしたらどうしますか?
そこで、検証をするわけです。さて、それをどうやって検証するかは、あなたが考えてみてください。そういう事を考えていくことが、多岐にわたる競馬の予想ファクターを複合的に考えていく基礎になっていきます。
因果関係という言葉がどうもしっくり来ていない方が結構いるようなので、その基本にある統計の使い方について説明してみます。
1.仮説をたてる
2.それを示すデータを元に、仮説が(正しい事を)検証する
統計は2.を手伝うためのツールです。(間違っている事を検証することが得てして多いのですが)つまり、1.の仮説無くして2.の検証をすることはできないのです。ただ、何も無いところから仮説をたてるのが厳しい場合に、次の方法が使われます。
0.データの傾向から、仮説を考える
最近もてはやされているデータマイニングは、まさに0.を実現するための方法です。ただし、0.だけでは何の意味も成さないのです。
例えば、POSデータなどをデータマイニングすることによって「雨の日は冷凍食品の売上が多い」という相関関係が出たとします。この相関関係を「分析結果」だと思う人がいますが、それは間違いです。例えばこれだけの情報で「雨の日に沢山冷凍食品を仕入れておけばいい」と判断してしまうと、間違いを招くことがあります。
この場合、2つのミスを犯す可能性があります。
一つ目は、因果関係を間違えるミスです。雨の日は実は顧客が少ない事を見越して店員がセール価格を出しているが故に冷凍食品がよく売れているのかもしれません。これは、雨の日が原因で、冷凍食品が売れるというのが結果だと単純に考えてしまった事によるミスです。
二つ目は、分析を見逃すミスです。実は雨の日が続いていたという事実を見逃し、その為に買い物を減らそうとした人達が冷凍食品を購入していたとすれば、単に一日だけ雨の日があっても売上は増えませんので、明日の天気予報だけを見て仕入れを増やすと失敗が起こります。
それでは、ミスをしない為には何が必要なのでしょうか。それが「因果関係の説明」になります。具体的には、なぜ雨の日に冷凍食品が売れるのか、その理由を「統計を使わずに」説明することです。それがしっかり説明できれば、いよいよ検証になります。例えばそれは、他の地域でも雨の日に冷凍食品が売れているかであったり、先月だけではなく他の月もそうであるのかを調べることであったりします。
競馬の場合、0.で傾向を発見しただけで小躍りしてそれをさも「分析結果だ」と思う人がとても多い。大事なのはその発見された傾向は「どういう理由でそうなったのか」を考える事です。その理由が原因と結果を結びつける理由であり、その理由が納得できるように説明できてはじめて「因果関係がある」と言えるのです。
因果関係の無い傾向を発見しても、それはそうなる理由が無い故に「たまたま」であり、継続的にその傾向が発生する保証はありません。よってその傾向を予想に使っても、次にそれがまた発生するとも言えないのです。つまり、当たらない予想となるわけです。
競馬で発見できる傾向は星の数程ありますが、明確に説明できる因果関係はそれほどありません。そういった状況の中でたったいくつかの傾向を発見したとしても、因果関係をしっかり説明できるものは少なく、さらにそれが競馬の結果に重要な要因と成りうるものになることはごくごくまれです。
それでも、それを探るのが競馬の予想の楽しみでもあるわけですけどね。
そこで前回の内容を考えてみましょう。武豊の勝率がだんだん下がってきて、連対率が落ちてきていること。サンデーの血統の濃い馬がだんだん減ってきていること。この2つの相関からあてずっぽうで考えられたものだったとしたらどうしますか?
そこで、検証をするわけです。さて、それをどうやって検証するかは、あなたが考えてみてください。そういう事を考えていくことが、多岐にわたる競馬の予想ファクターを複合的に考えていく基礎になっていきます。