社内ニートに成り下がってしまい暇なため、エクセルで統計の勉強でもできないか?何か統計をアウトプットに生かせないか?と思って適当に統計のエクセル関数をグーグルに教えてもらいながら色んな物と物との相関係数を計算してました。

 

発見があったのが、国内の出生率と大学進学率の相関係数をエクセルで計算したところ-0.76になったということ。

出生率のデータは厚生労働省から、大学進学率のデータは文科省の統計資料のHPからダウンロードできました。。

 

詳しい算出法は他で整理します。youtubeとかで動画にするのも面白いかもしれません。。

 

相関係数は一見して関連があるのかないのか判断できない二つの事象があった際、その二つの事象の関連性の高さを数値化したものです。

値の絶対値が1に近ければ近いほど二つの事象には高い関連性が認められるということになります。

大体絶対値が0.7以上の場合は高い相関関係にあると思っていい。

 

-0.76っていうのはかなり高い負の相関関係にあるということを示している。

つまり大学進学率が高くなると出生率が低くなるという強い相関関係があるということ。

 

もっと踏み込んで分析するなら、社会が高学歴化するとその社会は少子化が進むということですね。

大勢の市民が大学に進学したら婚期が4年先送りされるし、親の子育ての労力は増えるなどするので、少子化にむかうとかそういうミクロな要素があるのかもしれませんね。

注意しなければならないのは、統計分析は相関関係を与えてはくれるものの因果関係は教えてくれないということです。

もしかしたら社会が少子化することによってその社会は高学歴化が進むのかもしれない。例えば一人っ子の過程の場合はその子供にリソースを沢山注ぐので大学まで進学しやすい社会になるとか。

 

遊び半分でいろんなデータとデータの相関係数を計算していましたが、神ソフトエクセルのおかげでいろんな事象のデータをダウンロードして、correl関数で即座に二つの事象の間の相関係数が計算できます。

 

統計学は中心極限定理やベイズの定理などややとっつきにくいテーマが多いですが、意外と実践しやすい分野なのかもしれませんね。

 

例えば、平均気温とアイスクリームの売り上げや、温度と物質の動粘度など自分で二つの事象の間に何らかの相関関係があると予想して、データを取集、エクセルで相関係数を計算して検証してみるなどいろいろ遊べそうですね。