全国の都道府県別平均寿命が発表された。男性79.59歳、女性86.35歳だそうだ。
そういえば、1万年ぐらい前から18世紀までの人類の平均寿命は20数歳、1900年の統計では31歳だったそうである。
この100年ぐらいの間に突然延びたわけだ。
平均寿命とは、0歳における平均余命を示す。平均余命とは、ある年齢の人々がその後何年生きられるかという期待値のこと。決して難しいことを言っているわけじゃないが、定義とはこういう書き方をするから、ややこしい。
くだんのデータ、男性と女性とでは値が異なるが、今、ここで両方を分析するのは面倒だから、取り急ぎ男性の分だけ分析する。女性分については、気が向いたら後で分析してみる予定。
このデータを基に、読み取れる現況をまとめて記録しておこう。そこに隠された事実の解明や将来予測については、いずれ考えてみる。尤も、考える前に小生が寿命を迎える可能性もあるが。。。
その前に、平均の算出方法として、相加平均と二乗平均平方根という2つの方法について記述しておく。
平均の算出には、相加平均と二乗平均平方根という方法がある。
通常参照される平均値の求め方は、小学校の頃に学ぶ、いわゆる平均の求め方で、正式名称は相加平均といい、次の様に表される。
数式にすると堅苦しいが、要はサンプリングされた数を合計し、サンプリングした数で割るという方法で、ごく一般的に使われる平均値の求め方だ。
この方法、計算も簡単だし、平均という意味では間違いではない。しかし、この方法だとサンプリングされたデータのばらつきは表現できない。例えば、こういうことだ。
1年1組と1年2組という二つのクラスがあったとする。あるテストを行った結果、両クラスとも平均点は50点だった。しかしよく調べてみると、1組には100点の子もいたし0点の子もいたが、2組は大体50点の子ばかりだったという。
この二つのクラスを比較した場合、たとえ平均点が共に50点だったとしても、1組は生徒のテスト結果がばらついているのに対し、2組は生徒のテスト結果が大体同じとなるのだから、この二つのクラスにおける生徒の「出来」は全く同じではない。
この2クラス、同じ50点平均のクラスとして、今後も同様の扱いをしてよいのだろうか?
この違いを値として表現するには、データがばらついているかどうか、ばらついているとしたら、どの様にばらついているかを示す必要がある。これを示す方法が二乗平均平方根だ。
話を簡単にするために、各クラスの生徒数はそれぞれ2名だったとする。テストの点数結果は、1組は100点と0点だった。2組は2名とも50点だった。
この場合、1組の相加平均は(100+0)÷2=50。2組の相加平均は(50+50)÷2=50。つまり同じとなる。
一方、二乗平均平方根で結果を求める。この計算式は次の通り。
サンプリングされた数を二乗して合計し、サンプリングした数で割った後、平方根を取るという方法だ。
実際に計算してみると、
1組:√(100^2+0^2)/2=70.712組:√(50^2+50^2)/2=50.00
このように1組と2組では、計算結果が異なってくる。この結果から、最もばらつきのない場合の50点と比較して結果が離れているほど、ばらつきがあることを示す。データのばらつきは、こういう方法で表すことができる。
さて、この方法を用いて平均年齢の地方別ばらつき具合を見てみよう。
‐ 日本全体でみる場合、平均寿命は相加平均、二乗平均平方根共に79.59歳となっており、ばらつきは少ない。
‐ 地方別でばらつきが大きい地方は東北地方。相加平均が78.748歳であるのに対し、二乗平均平方根の値は78.753歳と、各地方の中では最もばらつきが大きい。ちなみに、青森県は77.28歳、山形県は79.97歳である。
‐ 更に、東北地方は相加平均の寿命も低い。
‐ 青森県は平均寿命の値も77.28歳と全国最低。
‐ 一方、ばらつきが最も少なかったのは四国。相加平均も二乗平均平方根も共に79.03歳。中国地方も両平均値共に、ほぼ79.45歳で次点となっている。ただし、両方とも全国平均の値よりも下回っている。
こういう比較データについて、諸外国ではどの様に違うのか、興味深い。日本の場合だと、若干のばらつきはあるものの、大体肉薄している。
この結果をどう解釈するかは今後考えるとして、こういう見方でデータを分析してみると、また違った事情が見えてきそうだ。




