2022(令和4)年 国民生活基礎調査の概況 所得の分布状況
このデータを使って色々とやってみる。まずは図表はこんな感じである。
この所得って恐らく賃金所得だけでなく諸々の所得が入っているのではと推測。
中央値と平均値を比べると中央値の方が小さい。形も対数正規分布に似ている。
これをちょっとエクセルでプロットしてみるとこんな感じ。
最頻値としては、年収200万~300万円の区間である。
さて、これ対数正規分布の曲線に近似できないかエクセルで対数正規分布で図を書いてみる。
平均と分散をやや調整する必要がある。やや調整を経て、確率密度関数と累積分布関数を次のように描くことができた。
近似曲線もある。これが驚くほど当てはまりが良いと思える。6次関数で上手く確率密度関数が、2次関数で累積分布関数が上手く当てはまった。対数関数でも当てはまりは良さそうである。
さて、次に賃金分布についても同様に見てみる。
令和4年賃金構造基本統計調査 結果の概況|厚生労働省 (mhlw.go.jp)
を見てみると、こんな感じの分布になっている。
2つのコブがある。これは対数正規分布での近似は難しかろう。試しにやってみると、あまりきれいな形にはならなかった。(現実通りにはならなかった。