統計というのは様々なジャンルで使われている有益な方法なんだけども、一方でとても危うい側面を持っている。
例えば、
みかんの消費量の年間グラフと、風邪の患者数の年間グラフは同じカーブを描く。
つまり、相関関係がある。
みかんを食べると風邪にかかりやすくなるのだ。みかんには風邪のウィルスを助ける働きがある。そんな統計が出ている。
さらに、
朝、パンを食べた生徒と、ご飯を食べた生徒では、パンを食べた生徒の学力のほうが低い。パンよりもご飯の方が脳の発育にはいいのだ。
さらに、
高齢で出産した子供のほうが、若年で出産した子供より学力が高いという統計がある。子供の学力は親の出産年齢によって決まるのだ。
さらに、
暴力的なゲームを好んでする子供は、暴力的な傾向にある。暴力的なゲームは子供に悪影響を与えるのだ。
なんていう嘘が統計的に導くことが可能なのだ。
解ってると思うけど、上記の話は嘘だし、全くの間違い。
端的に言えば、相関関係があるからといって、因果関係があるとは限らないわけだ。
一見関係があるように見えても、単なる偶然に過ぎないことも十分にあるということだ。
正しい統計学には、基準がある。学者によってその厳しさは違うらしいのだが、5項目とか7項目とか、その条件を満たさないと、その統計は正しいとはみなされないという基準だ。
その基準の中に、合理性というのがある。合理性とはまた曖昧ではあるが、統計とはそもそもそんな曖昧なものなのだ。
つまり、統計的に正しく有益といえるには、合理的に因果関係が説明できること。というのが基準にあるのだ。
最初のみかんの話だと、みかんを食べて風邪にかかりやすくなる、と思う人はいないし、そんな成分を含むというデータも無いだろう。とても合理的とは言えない。むしろ、みかんには風邪予防の効果があると思う人は多いはずで、だから風邪が流行する季節に予防として食べる人が増えるだけだ。と考えた方が合理的だし、もっと言えば、単にみかんの季節が冬だというだけと考える方が正しいだろう。
パンとご飯のはなしだとどうか?これはご飯のほうがより噛むので、噛む動作が脳に刺激を与えうんぬんと、もしかしたら合理的な説明も出来るかもしれない。でも、偶然の域は出ないだろうね。少なくとも、噛む動作が脳に良いというのが医学的に正しいとしても、ただそれだけの話で、パンよりもご飯が脳にいいとは言えないよね。よく噛んで食えという話だ。
高齢出産の話だと、医学的に高齢出産の子供と若年出産の子供の有意な差があるという話であれば可能性はある話なんだけど、そこに明確な合理的な根拠がないと極めて怪しい話。高齢で出産した場合の方が経済的に豊かである可能性も高いわけで、単により高度な教育が与えられただけだという予想も成り立つ。どっちが合理的だといえるだろうか?
さらに、暴力的なゲームの話。これは有名な奴ですな。
これは、騙されるほうがどうかしてるんだが、暴力的なゲームをしたから暴力的になったのではなく、単に、もともと暴力的な子供が暴力的なゲームを好んだだけの話だ。合理的に考えたらね。
ちなみに、よくロリコン犯罪なんかが起きて、犯人の自宅からロリコン同人誌なんかが出てくると、ロリコン同人誌を規制しろとかそういう話になったりする。でもこれもどうかしてる。ロリコン同人誌を読んだからロリコンになったんじゃなくて、もともとロリコンだから、ロリコン同人誌を買ったんだよ。当たり前だよね?
単に相関関係を示すだけで統計的に正しいかのように言っている嘘はかなり多い。
むしろ、相関関係があるということは、因果関係があるのだ。みたいな無茶苦茶な似非統計すら多い。
そんなあほな、という話だ。
統計的に正しいというのは、合理的に因果関係を示していなければいけないのだ。
まあ、統計には騙されないように、という話。というか、似非統計には気をつけましょうという話。嘘ばっかりだから。