ちょっと(?)息抜きしてましたが、統計学の勉強に戻ります。
>>>
標本から母集団分布の特徴として母数を推定することを
「母数の推定」と言います。
と、教科書には書かれていますが、そもそも「母数」って何?
→母数とは、母集団分布の特徴(平均や分散など)です。
_ 2
標本については標本平均x、標本分散s などのように
アルファベットを用い、
2
母数については母平均μ、母分散はσ などのように
ギリシャ文字を用います。
統計的推定には、
「点推定」と「区間推定」の2つの方法があります。
>>>
点推定とは
「母集団の未知の母数をひとつの値で推定する方法」
とあります。
しかしさっぱりわからず・・・。
_ n
母平均 μ ← 標本平均 x = Σ xi / n
i=1
2 2 n _ 2
母分散 σ ← 標本分散 s = Σ (xi - x) / (n - 1)
i=1
「標本からの統計量を母数の推定値とする」ということでした。
こういうことなら何だかハードルが下がって安心します(笑)
標本分散では偏差平方和を「値の個数n」で割ったのに対し
母分散では「n-1」で割った方がよい推定値となるとのことでした。
(不偏分散)
そして、この「n-1」を「自由度」と言います。(「ν」で表します)
>>>
区間推定とは
「未知の母数を1つの値で推定する代わりに
ある確率でその母数が区間[a,b]にあると言えるような区間を
もって推定する方法である」
とあります。
またまたわからず。。。
標本の値は母集団にも当てはまるだろうことはわかっているけども
完全に等しいわけではなくどの程度信頼できるのかわからないので
(サンプルに突飛な値が含まれているかもしれませんしね・・・)
母数が含まれると期待される区間を推定する方法とのことです。
少し見えてきたような気がします。
下限信頼区間 a ≦ 母数 ≦ 上限信頼区間 b
この区間に母数が含まれない確率をα(有意水準)とすると、
(1-α)を「信頼係数」(この区間に母数が含まれる確率)と言い
αを決めた時の区間を「(1-α)%信頼区間」と言います。
なので、95%の確率でその母数が含まれると推定される場合、
その区間は「95%信頼区間」で、「信頼係数0.95」となります。
(区間推定続きます)