医療統計学の章も終わりが見えてきました。ヾ(@^▽^@)ノ
「グラフを使った統計」の部分は簡単に目を通すだけのつもりなので、
(もちろんリポート問題はちゃんとやりますよ~)
実質あと数日の辛抱です♪
というわけで、はりきって「統計的仮説検定」行ってみます!
>>>
仮説検定とは?
ある母集団から抽出された標本の差異について
2つの対立する命題(帰無仮説と対立仮説)を立ててその「検定統計量」を求め、
その有意水準についてt分布表の値と比較する。
_ _
検定統計量 t = (X-Y) / (s×√(1/m+1/n))
ただし、
2 2 2
s = ( (m-1)s1 + (n-1)s2 ) / (m+n-2)
※(標本1の四角形の合計面積+標本2の四角形の合計面積)を
(標本1の個数+標本2の個数)で割ったものなので
「全標本の面積の平均」ということですね。
検定統計量が
「(t分布表の値)*-1~(t分布表の値)」の範囲内に入っていれば、帰無仮説を採択
「(t分布表の値)*-1~(t分布表の値)」の範囲内に入っていなければ、帰無仮説を棄却
(→対立仮説を採択)
という方法で「どちらかの仮説が真(かも?)」を判断します。
>>>
教科書にわかりやすい例が載っています。
[HDLコレステロール値の標本(男女別)]
_
女性(16人): 平均値x1=56.4 , 標準偏差s1=7.3
_
男性(12人): 平均値x2=50.4 , 標準偏差s2=7.6
より、
帰無仮説H0:「HDLコレステロールの平均値に男女差はない」(μ1=μ2)
対立仮説H1:「HDLコレステロールの平均値に男女差はある」(μ1≠μ2)
という仮説を立て、有意水準を5%とする。(自由度26)
2 2 2
分散 s = (15×7.3 + 11×7.6) / (16+12-2)
= (799.35 + 635.36) / 26
= 1434.71 / 26
= 55.18
検定統計量 t = (56.4-50.4) / (√55.18 × √(1/16+1/12))
= 6 / (7.43 × √(0.0625+0.0833))
= 6 / (7.43 × 0.3818)
= 6 / 2.8368
= 2.1151
t分布表の値は「t(0.05/2)(26)=2.056」なので、
検定統計量tは-2.056~2.056の範囲内に入っておらず
帰無仮説H0:「HDLコレステロールの平均値に男女差はない」は棄却されます。
(すなわち、対立仮説H1:「HDLコレステロールの平均値に男女差はある」を採択)
>>>
帰無仮説について。
帰無仮説は「棄却されることを期待して立てる仮説」です。
「多分棄却されるだろう」時に帰無仮説に設定するということですね。
(ただし、「2群に差があるか?」という命題の時には、
必ず帰無仮説は「違いはない」「等しい」と立てます。
よって対立仮説は「等しくない」「大きい」「小さい」などになります)
そして、ここの最重要ポイントは
「帰無仮説を採択することになっても『帰無仮説が正しい』にはならず
『棄却することはできなかった』『保留する』という解釈になる」
ということです!!
誤差なども起こりえるため
「必ずしも正しいことが証明されたということではない」
という消極的な推定となるんでしょうね。
>>>
ちょっと休憩してから続きます。