医療統計学の章も終わりが見えてきました。ヾ(@^▽^@)ノ


「グラフを使った統計」の部分は簡単に目を通すだけのつもりなので、

(もちろんリポート問題はちゃんとやりますよ~)

実質あと数日の辛抱です♪


というわけで、はりきって「統計的仮説検定」行ってみます!


>>>


仮説検定とは?


ある母集団から抽出された標本の差異について

2つの対立する命題(帰無仮説と対立仮説)を立ててその「検定統計量」を求め、

その有意水準についてt分布表の値と比較する。

              _  _

検定統計量 t = (X-Y) / (s×√(1/m+1/n))


ただし、


 2          2        2

s = ( (m-1)s1 + (n-1)s2 ) / (m+n-2)


※(標本1の四角形の合計面積+標本2の四角形の合計面積)を

 (標本1の個数+標本2の個数)で割ったものなので

 「全標本の面積の平均」ということですね。


検定統計量が


「(t分布表の値)*-1~(t分布表の値)」の範囲内に入っていれば、帰無仮説を採択


「(t分布表の値)*-1~(t分布表の値)」の範囲内に入っていなければ、帰無仮説を棄却

(→対立仮説を採択)


という方法で「どちらかの仮説が真(かも?)」を判断します。


>>>


教科書にわかりやすい例が載っています。


[HDLコレステロール値の標本(男女別)]

               _

 女性(16人): 平均値x1=56.4 , 標準偏差s1=7.3

               _

 男性(12人): 平均値x2=50.4 , 標準偏差s2=7.6


より、


帰無仮説H0:「HDLコレステロールの平均値に男女差はない」(μ1=μ2)

対立仮説H1:「HDLコレステロールの平均値に男女差はある」(μ1≠μ2)


という仮説を立て、有意水準を5%とする。(自由度26)


     2       2        2

分散 s = (15×7.3 + 11×7.6) / (16+12-2)

      = (799.35 + 635.36) / 26

      = 1434.71 / 26

      = 55.18


検定統計量 t = (56.4-50.4) / (√55.18 × √(1/16+1/12))

          = 6 / (7.43 × √(0.0625+0.0833))

          = 6 / (7.43 × 0.3818)

          = 6 / 2.8368

          = 2.1151


t分布表の値は「t(0.05/2)(26)=2.056」なので、

検定統計量tは-2.056~2.056の範囲内に入っておらず

帰無仮説H0:「HDLコレステロールの平均値に男女差はない」は棄却されます。


(すなわち、対立仮説H1:「HDLコレステロールの平均値に男女差はある」を採択)


>>>


帰無仮説について。


帰無仮説は「棄却されることを期待して立てる仮説」です。

「多分棄却されるだろう」時に帰無仮説に設定するということですね。


(ただし、「2群に差があるか?」という命題の時には、

必ず帰無仮説は「違いはない」「等しい」と立てます。

よって対立仮説は「等しくない」「大きい」「小さい」などになります)


そして、ここの最重要ポイントは

「帰無仮説を採択することになっても『帰無仮説が正しい』にはならず

『棄却することはできなかった』『保留する』という解釈になる」

ということです!!


誤差なども起こりえるため

「必ずしも正しいことが証明されたということではない」

という消極的な推定となるんでしょうね。


>>>


ちょっと休憩してから続きます。