こんにちは。
去年の夏に、統計学のセミナーを見つけて
おもしろそうってだけで受講しました。
受講後、もっと知りたくなって、
初心者向けの統計学の本を2冊ほど読んでみたんです。
ですが、本を読んでいても、
わからない…わからない…
ってなってしまった...
なので、思い切って今年の1月から
統計学の講座を受けてみることに
月1回の講義なので、まだまだ序の口ですが、
「へぇ~」って思ったことがあったので、
今日は、そのことについて書いてみようと思います。
よろしければお付き合いください。
中心の値は3つある?
早速ですが、「中心の値」と聞いて
どんなことを思い浮かべますか?
「中心の値」と聞いて、私が思ったのが
「平均」です。
全部のデータの値を足して、
データの個数で割る
ってやつですね。
でも、統計学ではなんと「中心の値」が
3つもあるんです。
1つ目は、上で書いた「平均値」
これが一般的に考えられている
「中心の値」ではないでしょうか?
2つ目は、「中央値」と呼ばれるものです。
データの値を大きさの順に並べた時の
「中心の値」です。
データの個数が奇数の場合には、
ある1つの値になりますね。
データの個数が、偶数個の場合には、
真ん中2つを足して2で割った値になります。
3つ目は、「最頻値」と呼ばれるものです。
カンタンにいうと、登場頻度が一番高い値になります。
そして、上記3つを統計学では「代表値」と言います。
で、英語ではAverage(アベレージ)って言うそうです。
Averageって、「平均の事じゃん」って思いますよね?
しかも、WEBで「Average 意味」で検索すると、
「平均」って出てくるし…
代表値=Averageと聞いた段階で、頭が混乱…
中心の値は何で3つも必要?
「中心の値」が3つもあるって時点で、
頭の中のシャッターが
ガラガラガラガラって
音を立ててしまっていく感じがしましたか?
と、いうことで、厚生労働省のデータを参考に
ちょっとだけ説明してみますね。
出典:https://www.mhlw.go.jp/toukei/saikin/hw/k-tyosa/k-tyosa19/dl/03.pdf
2019年に調査した所得金額をある範囲で区切った
世帯数の割合を示した表になります。
所得平均 552万円
中央値 437万円
最頻値 200~300万円
平均値、中央値、最頻値の
3つの「中心の値」で
結構、差があると思いませんでしたか?
私は、ニュース番組などで、
所得の平均金額って聞いたことはあるけど、
いまいち、ピンと来ていませんでした。
だって、自分の感覚としては、
全然しっくり来なかったのですよね~。
なぜなら、平均金額の552万円は、
極端に稼いでいる方達に引っ張られてしまうんですね。
もちろん、たくさん努力して、たくさん所得を得ているので
うらやましい限りです。
それに比べて、中央値の437万円は
極端に大きな値があっても影響を受けにくい
という特徴がありますよね。
私の感覚では、この中央値の437万円が
しっくりくる感じでした。
そして、最頻値の200~300万円は、
この区間の所得世帯数が
一番多いということになります。
13.6%です。
しかも、平均所得金額以下の世帯が
全体の約6割という…
ちょっと心配に思ってしまいます。
まぁ、かくいう私もここに入るのですが…
2019年調査ってことは、コロナの前のデータ。
2020年のデータはどうなっちゃうんでしょうか?
人の心配している暇があるなら、
自分の事を心配せんかー
という声が聞こえてきそうです…
ということで、
「中心の値って3つある」を
理解いただけましたでしょうか?
状況によって、どの「中心の値」を使うのかや
3つの「中心の値」によってどんなことが導き出せるのか
を考えると、ちょっと面白いと思いませんか?
今度、所得状況のニュースがあった時には、
どの「中心の値」になるのか考えてみてくださいね。
本日もお読みいただきありがとうございました。