「母集団の分散」は「サンプルの分散」よりいつもちょっと大きめになる。
サンプルの分散はサンプルの平均からの距離の二乗を合計し、
その合計をサンプルの大きさで割ることで計算できた。この計算の途中で、
合計をサンプルの大きさで割る代わりに合計をサンプルの大きさ引く1で
割ることにする。するとここでいう「母集団の平均はちょっと大きめになる」と
いう関係が数式で表されたことになる。
サンプルの大きさが大きくなればなるほど、大きめにする拡大率は「1」に
近づいていく。母集団の分散がサンプルの分散よりちょっと大きめで
サンプルの大きさを大きくすれば、真実を示す母集団に近くなりギャップは
縮小するという関係が数式できちんと表現できている。
1だけ少ない数を考えて割り算するだけで、「サンプルのデータ」から、本来
わからない「母集団の分散」がわかる。
1少ない仮想の数で合計を割れば、サンプルと母集団のギャップが自然に
埋まって「サンプルの分散」ではなく、本来知りたい「母集団の分散」がでてくる。
このような本当の個数ではない「仮想の個数」を統計では良く使う。この
「仮想の個数」のことを「自由度」という。自由度はサンプルという代用品から、
母集団という真実を推定する場合に利用されるもので、「本当の個数」とは
違った「仮想の個数」のことである。