帰無仮説と「強い相関はない」の関係
松井論文の報告はお楽しみいただけましたでしょうか。アクセス数が物凄いことになってビックリしました。まあ hotentry に出たからなんでしょうけど、それだけ「ソース」を求める要求が強いのかな、とも思っています。
ところで、今回久々に統計の教科書を読んでいて、面白かった記述があったので紹介します。『確率・統計入門』(小針晛宏、岩波書店)という本で、随分昔、統計の勉強をするために買ったのですが、検定のところは読んでいなかった(χ二乗分布関数については調べたいことがあったので、そのあたりだけつまみ喰いしましたが)。これ、結構面白い本なんですよね。いま amazon のレビューを見てみましたが、みなさん絶賛してます(って3人だけですが)。
検定の章の最初のほうに、帰無仮説Hについてこんなことが書いてあります。
さらに続けて、具体的な例が挙げられています。ある水産試験場Aで養育している金魚について、体長5cm以上のものは5%、7cm以上のものは1%いることがわかっていたとして、さて同種の金魚で体長6cmのものが持ってこられたときに、これはA試験場の水槽から取ってきたものかどうかを検定しましょう、というのです。
当然、まず帰無仮説として、
H: これはA試験場からの金魚である
をとります。すると、当然ながら、体長6cmの金魚ですから、
仮説Hは、有意水準1%では棄却(否定)できない
となります。しかし、A試験場には、5cm以上のものは5%はいるわけですから、有意水準5%では棄却できるわけです。
では、4.5cmの金魚だったら?
その一方、こんなことも書いてあります。
ある製薬会社が、鶏用に「ケッコッコー」という綜合ビタミン剤を売り出したとします。途中のデータや計算は省略しますが、製薬会社が「これをにわとりに与えると卵は5g以上大きくなる」と宣伝していたとして、これが正しいといえるかどうかを検定しましょう、というのです。この薬自体は、やっても効かないということは既に検定で明らかになっています。で、薬をやっていない集団とやった集団との平均の差が、この例題では-1.025g~3.425gの間が危険率5%で棄却できない範囲になりました(興味のある方は本を見てください)。「5g」という値は1%で棄却できるのですが、ということから、「99%の信頼率で製薬会社の宣伝はインチキな誇大広告だと告発できるのである」となります。
さらに重要なのがこの次です。
ところで、今回久々に統計の教科書を読んでいて、面白かった記述があったので紹介します。『確率・統計入門』(小針晛宏、岩波書店)という本で、随分昔、統計の勉強をするために買ったのですが、検定のところは読んでいなかった(χ二乗分布関数については調べたいことがあったので、そのあたりだけつまみ喰いしましたが)。これ、結構面白い本なんですよね。いま amazon のレビューを見てみましたが、みなさん絶賛してます(って3人だけですが)。
検定の章の最初のほうに、帰無仮説Hについてこんなことが書いてあります。
上の三つの方法のうち、特に検定については、論理の構造上非常に陥り易い落し穴がある。というのは、仮説Hというのは、棄却(否定)される時にだけ意味を持ちうる、まるで流しびなのようにはかない運命を背負った仮説なのである。これが危険率αで棄却(否定)できないからといって、うっかり情を移して'信頼率β=1-αで採用(肯定)できる'と言ってしまうと、《流しびなをしまい込むと禍が起る》という言い伝えが生命を吹き返し、文字通り禍が起るのである。このゆえに、仮説とはしばしば'帰無仮説'と呼ばれる。味わい深い文章でしょう。
さらに続けて、具体的な例が挙げられています。ある水産試験場Aで養育している金魚について、体長5cm以上のものは5%、7cm以上のものは1%いることがわかっていたとして、さて同種の金魚で体長6cmのものが持ってこられたときに、これはA試験場の水槽から取ってきたものかどうかを検定しましょう、というのです。
当然、まず帰無仮説として、
H: これはA試験場からの金魚である
をとります。すると、当然ながら、体長6cmの金魚ですから、
仮説Hは、有意水準1%では棄却(否定)できない
となります。しかし、A試験場には、5cm以上のものは5%はいるわけですから、有意水準5%では棄却できるわけです。
…体長6cmの金魚がA試験場からとれる確率は5%以下だから、有意水準(危険率)5%で、この仮説は棄却(否定)できる。つまり、目の前にいる1匹の金魚がA試験場からのものではない、どこか他の水槽で飼われた、より大型のものだと判定するとき、その危険率は5%以下である。ではその判定は99%確かか、と問い直されると、それほどの自信をもって太鼓判が押せるものでもない。というわけ。
では、4.5cmの金魚だったら?
これは金魚です。わかりやすいですね。統計の心が実によく説明されている。
と言う以外、何も言えないのである。相手がさらに何か言うのを待っている様子なら、'美しいですね'とか何とか言って、その場をしのぐしか仕方がないのである。つまり正解は
'95%の確からしさで、これがA試験場のものでないといえる'わけではない。
のである。否定できる時は意味があるが、否定できないときは、何もわからないのである。つまり無になってしまうのである。だから帰無仮説という名もついているのである。体長4.5cmの金魚では、A試験場のものかも知れないし、他所から持ってきたものかも知れない。二重否定は肯定だということを信じて疑わない読者は、よく味っていただきたい。'返さないとは言わない'は'返します'と同義ではないのである。
帰無仮説を肯定的に使ってはならない。
ということを、くり返し強調しておこう。
その一方、こんなことも書いてあります。
ある製薬会社が、鶏用に「ケッコッコー」という綜合ビタミン剤を売り出したとします。途中のデータや計算は省略しますが、製薬会社が「これをにわとりに与えると卵は5g以上大きくなる」と宣伝していたとして、これが正しいといえるかどうかを検定しましょう、というのです。この薬自体は、やっても効かないということは既に検定で明らかになっています。で、薬をやっていない集団とやった集団との平均の差が、この例題では-1.025g~3.425gの間が危険率5%で棄却できない範囲になりました(興味のある方は本を見てください)。「5g」という値は1%で棄却できるのですが、ということから、「99%の信頼率で製薬会社の宣伝はインチキな誇大広告だと告発できるのである」となります。
さらに重要なのがこの次です。
つまり'差がない'、'薬が無効である'という仮説は否定できなかったけれど、非常に効くとか、逆効果で2grも減ったとかいうことは否定できるのである。で、結論として'効くのか効かないのか'と迫られたら'何とも言えないが、ものすごく効くことはない'と答えるしかない、ということである。これを血液型性格判断の場合に当てはめると、松井論文(をはじめとする、心理学者による多くの結果)は、「血液型と性格に相関があるのかないのかと迫られたら、なんとも言えないが、強い(ものすごい)相関があるということはない」と答えられるということになります。「強い」って一見曖昧に見えるけど、こういう定量的な把握が重要なんですよね、検定では。
- 確率・統計入門/小針 あき宏
- ¥2,940
- Amazon.co.jp