統計学は科学でも証拠でもなく目安である

<はじめに>
 真に数学を志している者であれば既に知っていると思われるが、統計学は因果関係を証明する証拠品としては使ってはいけないという定義・大原則がある。

 しかしながら、嘆かわしいことに世の中の学者たちのほとんどは因果関係の正当性を語る道具として統計学を用いている。別に彼らが統計学をどう間違って解釈してもかまわないが、医学の分野においては統計学が「論文が正しいことを証明する道具」として、「人を信じさせる道具」として悪用され、嘘が蔓延する原因となっているのでこれは捨て置けない。

 ここではわかりやすく、統計学がどのような誤解を招くかを解説する。
 今も昔も、統計学的検定を「科学的証拠」ではなく、論者の意見の「正当性の目安」でしかないのだが、それを「科学」だの「証拠」だのと扱う風潮のおかげで誤った仮説が真実の化けの皮をかぶってしまう。この現状をどうにかして修正しなければならない。

<仮説が正しいかどうかはそもそも統計学では証明できない>
 学者たちは自分の仮説が理論的に正しいかどうかを統計学的な確率を用いて証明するという手法をとる。

 例えばある鉄道会社の男女比を他の一般的な企業社員の男女比と比較し「運転手の男女比は明らかに男に偏っている」ということが数学的に証明する。しかしながら「なぜ偏っているのか」の理由については、統計学は何も語らない

 ところが多くの学者たちは例えば「電車の運転は男性を心理学的に優越に浸らせるが女性にはそれがない」という原因・理由を仮説・推論として語り、その証拠を示すがごとく統計学を用いる。

 だが、真の理由は統計学からは出ない。

 実際は「産休がとりやすい職業ではない」「女性らしい職業ではないので男性に変に思われる」「体を酷使する過酷な労働である」などの複雑な理由が絡み合っており、「男性の心理的優越感」という単純な問題ではない。

 悪い言い方をすると論者は統計学を悪用し、真実でない仮説を真実のように見せかけている。が、このような悪用は学者たちによって今も昔も行われている。

 統計学は事象が起こる確率を出すが、事象が起こる理由については一切語れない数学であるという根本的なことを、学者たちはあまりにも無視しすぎていると思う。
 物事の因果関係は人間が考えているよりももっともっと複雑な理由が絡み合っている。

<関連と因果関係は異なる次元のもの>
 女性は女子トイレを利用する。だから女性と女子トイレ利用の関連づけは統計学的に有意さを証明できる。「女性であることは女子トイレ利用と関連性あり」という言い方ができる。
 しかし、「女性だから女子トイレを利用する」と「だから」という語句を用いて因果関係を言うことは正しくない。

 例えば家族は男女ともに家の中にある一つの共用トイレを利用している。女性であっても幼児はお父さんと一緒に男子トイレを利用することもある。

 すると、「女性だから」女子トイレを利用するのではなく、女性は女子トイレを利用するという常識、ならわし、特権、利便さがあるから女子トイレを利用している。女子トイレが混雑していて男子トイレを利用したいと思う時があっても、周囲の目があるから女子トイレを使っている。それは女性であるからという理由で女子トイレを利用しているわけではないことがわかる。真の理由は複雑な事柄が重なり合っている。

 逆も言える。男性だから女子トイレを使わないのではない。男性が女子トイレを使うことで社会的制裁があるから使えないのである。
 関連があることを確率論的に証明できても、因果関係は言えないのが統計学

<関連性と因果関係の違いを考える>
 因果とは原因と結果のことをいう。何かが起こり、その結果どうなったか?の関係である。
例えば「株価が2倍に跳ね上がった状態が1年続いた」という事件が起こったとする。
その結果様々な影響を引き起こす。

 サラリーマンの給料が上がる自由に使えるお金が増える→女性をデートに誘えるので浮気が増える…と社会に株価上昇の影響が出る。一方で

 サラリーマンの給料が上がる→タクシー利用者が増える→客待ちのタクシーが減るので六本木通りの混雑が緩和される…と別の影響も出る。

 これらの出来事を統計学的に関連付けてみる。
 六本木通りの車の混雑と浮気件数の関連性を統計学的に検定すると「有意に関係がある」と出る。つまり六本木の混雑と浮気の関連性を科学的(数学的)に証明したことになる。

 しかしこれはあくまで関連性であり、六本木の混雑が緩和されたから浮気件数が増えたわけではない。六本木の混雑と浮気件数には因果関係は成り立たない

 実際は株価が2倍に跳ね上がって浮気が増えるという因果関係があり、同様に株価が2倍に跳ね上がって六本木の混雑が緩和されたという因果関係がある。

 浮気も混雑緩和も結果であり、この二つの結果を「原因と理由」で結び付けることを、統計学的な検定を用いて「正しいことだ」とすることをやってはいけない、言ってはならない。

 言ってはならないが、事実、統計学医的検定では浮気と混雑緩和は「関連あり」と出る。そして学者たちはその理由を勝手に推測し、それを先ほどの統計学的検定を用いて「科学的に証明されている」と世間に発表する。
 
<統計学はこれほど意味がない>
 ここで統計学的な命題を一つ挙げる。
 「日本ではハイオクガソリン使用とタイヤの減り具合は関連性がある」
 これはおそらく検証すれば統計学的にしっかり証明できる。それは次のような関連性があるからだ。

 ハイオクガソリン使用→国産車よりも外車で多い→外車は車体が重く加速も激しい→運転も急加速になりがち→タイヤの減りが早い。
 このようにハイオクガソリン使用とタイヤの減りの早さは関連性があるが
「ハイオクガソリンを使うことが原因でタイヤが減るのが早い」と発表することは間違っているということは誰にでもわかる。

 ここで「ハイオクガソリン」と「タイヤの減り」の関連性を統計学的に証明して何の意味があるというのだろう。意味などないし、意味を持たせてはいけない。意味(因果関係)を持たせることは作為的であり嘘となる。

 医学ではこの「意味を持たせてはいけない」はずの統計学に作為的に因果関係を結びつけるという手法が嘘を蔓延させてしまい問題となる。

 例えば、現在世界中で「骨粗鬆症治療薬が原因で顎骨壊死が起こりやすい」という話が歯科学会経由で広まっているが、この話もそもそも「統計学で因果関係を語ってはいけない」という原則をあっさり無視して広まったデマ(歯科医は真実であると信じているが医師はデマだと思っている研究者が多い)である。

<私が体験した統計学の誤解>
 私は自分の研究でこんなことを経験した。
 ステロイドを使用すると下垂体機能が抑制され、ACTHが下がるというデータをとっていた。

 すると高コレステロール治療薬を服薬している人にステロイドを使用するとACTHが有意に下がりやすいという関連を偶然見つけてしまった。この発見は一大事だと思った。なぜならコレステロールを下げる薬で下垂体機能が低下するなら大きな薬害だからだ。しかも現在、高齢者の多くが高コレステロール治療薬を使用している。

 ところが、その後の私の追加研究で、コレステロールが高い者が有意にACTH低下が起こることを発見した。コレステロールが高い者は治療薬を服薬する。だから「薬を飲んでいる人のACTHが低下しやすい」と誤解していたのだということに気づいた。

 つまり、薬のせいでACTHが低下しているのではなく、コレステロールが高いことでACTHが低下すると判断するに至った。薬害ではなかった。むしろその逆である。もしも私が「コレステロール治療薬が原因で下垂体期のが原因で低下する」と発表してしまったら、世界に嘘が蔓延する。

 そして実際にこのような浅はかな思慮で嘘が蔓延してしまう事例は、先ほど述べた「骨粗鬆症治療薬が原因で顎骨壊死が起こりやすい」というようなデマが現在進行形で起こっていることから、無視できない悪影響を及ぼすことが分かる。デマを打ち消すには大変な労力がかかる。デマを証明できるものも存在しないからだ。

 事実無根、誤認であることを証明するにはデマを作った論文の何十倍もの反対理論を用意しなければならない。何十倍もの反対論文が出てくるには何十年もかかるので、結局デマは何十年も残るのである。詳しくは「骨粗鬆症治療薬で顎骨壊死を引き起こすの真偽」を参考にしてほしい。

<統計学では反対論も正論になる>
 統計学がいい加減であると述べた理由は他にもある。統計学ではp<0.01などと「pが起こりうる確率は1%未満」だから、そんなことは偶然では起こらない。よって関連がある」とする学問である。

 だが、同じ研究をする者が世界に100人いれば、その一人には1%の確率で起こる現象が100%近い確率で起こる。つまり、100人の学者がいれば必ず正反対の結果を出す学者がいる。これも統計学的に証明される。問題はこの反対論者の理論を採用する者とそうでない者同士の理論が対立してしまうことである。

 Aという結果と、その真逆のBという結果がある。Aの理論に賛成の者はAが正しいと主張し、Aを証拠品として扱う。Bの理論に賛成の者はBが正しいとしてBを証拠品として扱う。AとBのどちらが正しいかは誰にも証明できない。

 ただ、Aを支持する者とBを支持する者の数には差が出るだろう。数が多い方が正論になるというのが科学の特徴である。科学が多数決で決まるあたり滑稽である。

<論文の正当性は必要十分条件で決めていく>
 例えば、誰にでもわかるこんな例を挙げる。
 ある学者が河川の治水工事と河川の氾濫の数を世界規模で調べた。フランスでは治水工事数も少なく氾濫も少ない。一方日本では治水工事も多く氾濫も多い。

 とても単細胞な学者は「治水工事が河川が氾濫する原因と推測できるから、治水工事を即刻やめるべきだ」と主張した。この単細胞な学者は「統計学では治水工事と氾濫数が強く関連しているという科学的証拠がある」と主張した。が、これが間違いであることは学者でなくても誰にでもわかる。

 河川が氾濫する本当の原因は降水量である。雨が多いから河川が氾濫する。治水工事のせいで氾濫するのではなく、治水工事は氾濫を防ぐために行っている。

 だがこの学者が学会の権威者であったらどうだろう。彼の説は学会で承認され、それ以来治水工事が行われなくなった。そして河川の近くに住む人たちは洪水で死者が何百人と出たとさ…。

 こんな愚かな話は、医学では日常茶飯事に起こっている。特に食品と健康、食品と病気の因果関係で世界には常に嘘が蔓延している。チーズがヨーグルトが骨粗鬆症に効果的と発表された翌年に、チーズ・ヨーグルトは高蛋白なので骨粗鬆症を引き起こすと発表される。

 論文の正当性は統計学では述べられないことが統計学の大原則であると何度も言っている。

<因果関係の正当性を示すものを求めて>
 では正当性を証明する者が何もないのかというとそうではない。「逆も真なり」という法則が唯一、論文の正当性をある程度証明できるものである。

 たとえば「Aが原因でBが増える」という命題があったとする。
 もしもこの命題が正しいのであれば次のようなことが必ず証明される。

「AをやめればBが激減する」
「Bが少ない地域ではAを使用していない」
「Cが原因でBが増えるというような他の関係がない」
「CをやめればBが激減するというような他の関係がない」
「AをやめてもCをやめてもBが激減するが、Aの影響が圧倒的に高い」
「Aを用いてもCを用いてもBが増えるが、Bの影響が圧倒的に高い」

 これらの中で一つでも証明できないものがあれば命題は正当とは言えない。
現在世界にある医学論文で、これらの全てを検証している論文は皆無に近い。よって医学論文自体が信用性が低いものとなっている。

 しかし、医学論文は他の学界の論文よりも正当性があるとされる分野である。ならば他の学問分野での論文はもっともっといい加減であることが推測できる。社会学、経済学、政治学、心理学…そのいい加減さは医学の比ではないだろう。

<統計学で因果関係をいいたいなら最低6つの条件が必要>
 統計学で因果関係を推測してはいけないのがこの学問の大原則である。因果関係を推測したいのなら最低でも上の6つの条件を統計学的に証明しておかなければならない。

 6つを準備するためには多くの学者の長年の協力が必要となる。1人では決してできない。よって論文自体が「世界が重大な関心をよせるトピックス」でない限り、6つの条件は揃わない。世に出ている99%の論文は世界が関心を寄せないものであるから、検証されることはない。よって世に出ている99%の論文は信用性が低い

 私が今、ここで述べたことは学識者であるならば全員が知っていなければならない常識であるはずなのだが、これを真摯に守れば、自分が生きている間に研究実績を示すことができない。したがって「研究成果を世に出したい」という人間の古典的な欲望が、科学をねじ曲げてしまうということが今も昔も未来も起こる。私が何と言おうと防げるものではない。

 残念なことにデマはたやすく世に広がり、間違った事実で多くの患者が被害を受けるのが医学界である。間違った事実が修正されるには、デマを提唱した学者が死去していることが必要になることが多い。なぜなら学者の多くは権威者であるからだ。よって私はデマが修正されるまで50年近くかかると予想している。

 できればこの文章に対して多くの片からご意見いただきたく、ブログに掲載させていただきました。気軽に文章を書き込んでいただけたら幸いです。