funamu-shiのブログ

funamu-shiのブログ

ブログの説明を入力します。

Amebaでブログを始めよう!
なぜ不偏分散は(n-1)で割るのか、いろいろ調べてまとめてみた。

たどりついた考え方

母集団の平均…μ
標本の平均…M =(ΣXi)/n
母集団の平均と標本平均の差…M-μ=d
母分散…σ2
標本分散…V(X)
dの分散…V(d)
Σ…Xiについて、i=1,2,3、…nまでの総和


・標本は、母集団の一部からとってきたもの。だから標本の平均Mと母集団の平均μは必ずしも一致しない
・μを使うよりもMを使った方が、分散は小さくなる(μよりもMのほうが、各標本からのズレは小さいから)
 →標本分散V(X)が母分散σ2を過小評価してしまう理由

・V(X)はσ2に比べて、標本平均と母集団の平均とのズレ(|M-μ|=d)の分だけ分散を過小評価している
・式で表すとこんな感じ?
 V(X)=Σ(M-Xi)^2 /n 
    =Σ(μ-Xi-d)^2 /n

・標本達がμからどれだけ離れているか(=σ2)と、dがどれだけばらつくものであるか(=V(d))は独立した事象なので次の式が成り立つ
 V(X)=Σ(μ-Xi-d)^2 /n
    =(Σμ-Xi^2/n) - (Σd)/n
    =σ2 - V(d)  …式1

・d=M-μ、M =(ΣXi)/n なので
 V(d) = V(M-μ)
    =ΣM-^2 /n
    =M-μ^2
    =(ΣXi)/n-μ^2
    =(ΣXi)/n-nμ/n^2
    =(ΣXi-μ)^2/n^2
    =σ2 /n

・これを式1にぶちこむと
 V(X)=σ2 - V(d)
    =σ2 - σ2 /n
= (n-1)σ2 /n
これを変形すると
 σ2=nV(X)/(n-1)

V(X)=Σ(M-Xi)^2 /nなので
σ2=Σ(M-Xi)^2/(n-1)

よって、母分散σ2を推定するには平均和をnではなく(n-1)で割った方が精度がよいということになる。


・・・この考え方で合ってるのかな?