平均値の鵜呑みは危険 | 統計解析道具箱~はじめての統計分析~

統計解析道具箱~はじめての統計分析~

Statistics never lie but liars use Statistics

データの要約をする際に平均値を使うのは常識ですが、この平均値なるものはデータの総和(すべて足し合わせたもの)をデータ数で割ることによって計算するところから、極端に大きな値や小さい値の影響を強く受ける統計量になります。

有名な話ですが、平均値は慎重に吟味する必要があるということです。

よく知られているのが、平均貯蓄額や平均所得などの例でしょう。
平成20年7月に公表された平均貯蓄額(二人以上の勤労者世帯、現在貯蓄高から負債額をマイナスしたもの)によると、全体平均は、1,294万円になるわけですが、一般的な世帯から見るとこの数字はかなり高いものに感じられるのではないでしょうか。

例えば、サラリーマンの平均的な所得は、400万円~500万円くらいといわれますが、この年収階級でみると平均貯蓄高は、768万円まで下がります。だいぶ低くなりますが、それでも実情にあわないと感じる方も多いのではないでしょうか。さらに、この層の詳細をみると、貯蓄高が100万円に満たない世帯が、この層の21%を占めることがわかります。

統計の有名なアイロニーに、以下のものがあります。
Statictics has been described as the science which tells you that ifyou lie with your head in the oven and your feet in the refrigerator,on average you'll be comfortably warm.
(統計学とは、頭がオーブンの中にあって、足が冷蔵庫の中にあれば、平均して快適である、と表現する科学である)

その平均値が本当にデータの実情を捉えているか、きちんと要約できているかを知るためには、標準偏差(SD)や最小値・最大値を調べる、データの中身をしっかりと吟味する必要があり、頭から平均値の数字を信用しないことが大切ではないでしょうか。

ちなみに、司法書士(不動産登記や商業登記を請け負う書士)の平均年収が1,400万円だそうですが、この数字だけを鵜呑みにして受験に挑戦する人も少なくないとか(試験はかなり難しいそうです)
しかし、知り合いの司法書士によれば、最頻値は400~500万円くらいじゃないだろうか、とのこと。

平均値は、データの真実をゆがめて表現してしまうこともあるので、取り扱いには注意です。