なぜ不偏分散は(n-1)で割るのか、いろいろ調べてまとめてみた。
たどりついた考え方
母集団の平均…μ
標本の平均…M =(ΣXi)/n
母集団の平均と標本平均の差…M-μ=d
母分散…σ2
標本分散…V(X)
dの分散…V(d)
Σ…Xiについて、i=1,2,3、…nまでの総和
・標本は、母集団の一部からとってきたもの。だから標本の平均Mと母集団の平均μは必ずしも一致しない
・μを使うよりもMを使った方が、分散は小さくなる(μよりもMのほうが、各標本からのズレは小さいから)
→標本分散V(X)が母分散σ2を過小評価してしまう理由
・V(X)はσ2に比べて、標本平均と母集団の平均とのズレ(|M-μ|=d)の分だけ分散を過小評価している
・式で表すとこんな感じ?
V(X)=Σ(M-Xi)^2 /n
=Σ(μ-Xi-d)^2 /n
・標本達がμからどれだけ離れているか(=σ2)と、dがどれだけばらつくものであるか(=V(d))は独立した事象なので次の式が成り立つ
V(X)=Σ(μ-Xi-d)^2 /n
=(Σμ-Xi^2/n) - (Σd)/n
=σ2 - V(d) …式1
・d=M-μ、M =(ΣXi)/n なので
V(d) = V(M-μ)
=ΣM-^2 /n
=M-μ^2
=(ΣXi)/n-μ^2
=(ΣXi)/n-nμ/n^2
=(ΣXi-μ)^2/n^2
=σ2 /n
・これを式1にぶちこむと
V(X)=σ2 - V(d)
=σ2 - σ2 /n
= (n-1)σ2 /n
これを変形すると
σ2=nV(X)/(n-1)
V(X)=Σ(M-Xi)^2 /nなので
σ2=Σ(M-Xi)^2/(n-1)
よって、母分散σ2を推定するには平均和をnではなく(n-1)で割った方が精度がよいということになる。
・・・この考え方で合ってるのかな?
