知人がドイツ語の勉強のために,村上春樹の猫のピータのことを,英語とドイツ
語に翻訳した.ドイツ語を勉強している方には参考になると思うので,ここに掲
載する.問題があるようでしたら御連絡下さい.
ある人がどれだけ特殊かというのを図で示してみよう.図1で塗りつぶされている部分が,x <= +-
1σの中に入る人達である.ガウス分布では,中心が平均で,平均近くに沢山の人がいる.そして,平均から遠ざかっていくと ---
つまり特殊な人になると --- その数は急激に減っていく.図2で塗りつぶされている赤い部分が,x <= +-1σ
の中に入らない人達である.
図1
図2
実はこの図形の面積は全部で 1 になるようにしてある.だから面積を計算すると,どれだけ特殊なのかがわかるようになっている.さすがはガウス.
この値は私には手では計算できないので,ある賢いプログラムに尋ねてみると,図1の青い部分の面積は,0.6827 であるということである.つまり,68% の人は1σの人(正確には +-1σ)なのであった.さて,統計では,「普通の人」の割り合いは +-2σ (95.4%) か +-3σ (99.7%) がよく使われる.「普通の人」とは何かとは残念ながら数学では決まっていない.そこで,統計をとる人が勝手に決めるのである.ある政府は,「普通の人」を決める σ を統計によって変えるので,できればやめて欲しい.これはかなり恣意的で,たとえば,お客様満足度を測るとき,+-0.5 σ を「普通のお客様」ということにすれば,なんと 38% のお客様(半分以下!)が満足しているだけなのに,全ての「普通のお客様」が満足してしまうのである.これはまいった.残りの満足していないお客さんは,異常な客と数字の上でみなすのである.
では,私の友人の 6σ の人と呼ばれた人はどこにいるのだろうか.図3の面積がそうである.見えません!
図3
計算してみると,
ans =
1.9732e-009
二億に一つの可能性になってしまった.日本にいる可能性は少ない.0.0001 *0.03 = 0.00003 (3e-6) は,100万人に3人なのでちょっと6σは言いすぎかもしれない.計算してみると,4.5σ位が丁度良いようである.ですから,今後彼女を 4.5σ の女性と呼ぶのは悪くはないであろう.
図1
図2
実はこの図形の面積は全部で 1 になるようにしてある.だから面積を計算すると,どれだけ特殊なのかがわかるようになっている.さすがはガウス.
この値は私には手では計算できないので,ある賢いプログラムに尋ねてみると,図1の青い部分の面積は,0.6827 であるということである.つまり,68% の人は1σの人(正確には +-1σ)なのであった.さて,統計では,「普通の人」の割り合いは +-2σ (95.4%) か +-3σ (99.7%) がよく使われる.「普通の人」とは何かとは残念ながら数学では決まっていない.そこで,統計をとる人が勝手に決めるのである.ある政府は,「普通の人」を決める σ を統計によって変えるので,できればやめて欲しい.これはかなり恣意的で,たとえば,お客様満足度を測るとき,+-0.5 σ を「普通のお客様」ということにすれば,なんと 38% のお客様(半分以下!)が満足しているだけなのに,全ての「普通のお客様」が満足してしまうのである.これはまいった.残りの満足していないお客さんは,異常な客と数字の上でみなすのである.
では,私の友人の 6σ の人と呼ばれた人はどこにいるのだろうか.図3の面積がそうである.見えません!
図3
計算してみると,
ans =
1.9732e-009
二億に一つの可能性になってしまった.日本にいる可能性は少ない.0.0001 *0.03 = 0.00003 (3e-6) は,100万人に3人なのでちょっと6σは言いすぎかもしれない.計算してみると,4.5σ位が丁度良いようである.ですから,今後彼女を 4.5σ の女性と呼ぶのは悪くはないであろう.
給料の平均と分散
まずは分散の話になってしまって,話がちょっと前後してしまったが,平均についても話をしておこう.
ある会社 A の給料の平均が,月に 255 万円と聞くと入社したくなるかもしれない.しかし,この会社は現在社長一人に社員一人の会社で,社長が給料 500 万円,そして社員の給料は 10 万円で,平均して 255 万円なのである.このような場合,平均というのはどうも怪しい.また,会社 B も同じく2人の社員であるが,社長の給料は月 300 万円,社員の給料は 210 万円である.
会社A
社長の給料500万円
社員の給料10万円
平均 255 万円
会社B
社長の給料300万円
社員の給料210万円
平均 255 万円
これらの会社の平均月給は同じである.私が社員として入社する場合には,会社B の方が良いのだが,もし,平均の月給しか教えてもらえない場合にはこれらの会社の区別はつかない.これは困ったぞ!
そこで,統計では平均からの差の二乗平均も考える.これは平均からどれだけ離れているかをシーソーに載せて考えたようなものである.この値が小さいということは皆が平均近くにいるということである.そうすると平均というものがより信頼できそうだ.皆が平均より遠い場合には会社 A みたいなことが起きているに違いない.まあ,詳しい式は Google で「分散」とか「標準偏差」探してみるといいだろう.標準偏差を計算してみると,以下の表のようになる.
会社A
社長の給料500万円
社員の給料10万円
平均 255 万円
標準偏差 273.9
会社B
社長の給料300万円
社員の給料210万円
平均 255 万円
標準偏差 31.8
二つの会社の平均は同じだが,B の会社の方がばらつきが少ないので,標準偏差は少ない値になった.平均ではわからなかった差が見えた.これが分散や標準偏差が統計で使われている理由である.σ とは統計で,慣習的に標準偏差を示す文字である.
さて,平均というのは結構ごまかしができることはわかったかもしれない.もちろん平均は重要である.偏差値というのは平均とは違う性質を示す値であり,これらを上手く使うと便利である.
まずは分散の話になってしまって,話がちょっと前後してしまったが,平均についても話をしておこう.
ある会社 A の給料の平均が,月に 255 万円と聞くと入社したくなるかもしれない.しかし,この会社は現在社長一人に社員一人の会社で,社長が給料 500 万円,そして社員の給料は 10 万円で,平均して 255 万円なのである.このような場合,平均というのはどうも怪しい.また,会社 B も同じく2人の社員であるが,社長の給料は月 300 万円,社員の給料は 210 万円である.
会社A
社長の給料500万円
社員の給料10万円
平均 255 万円
会社B
社長の給料300万円
社員の給料210万円
平均 255 万円
これらの会社の平均月給は同じである.私が社員として入社する場合には,会社B の方が良いのだが,もし,平均の月給しか教えてもらえない場合にはこれらの会社の区別はつかない.これは困ったぞ!
そこで,統計では平均からの差の二乗平均も考える.これは平均からどれだけ離れているかをシーソーに載せて考えたようなものである.この値が小さいということは皆が平均近くにいるということである.そうすると平均というものがより信頼できそうだ.皆が平均より遠い場合には会社 A みたいなことが起きているに違いない.まあ,詳しい式は Google で「分散」とか「標準偏差」探してみるといいだろう.標準偏差を計算してみると,以下の表のようになる.
会社A
社長の給料500万円
社員の給料10万円
平均 255 万円
標準偏差 273.9
会社B
社長の給料300万円
社員の給料210万円
平均 255 万円
標準偏差 31.8
二つの会社の平均は同じだが,B の会社の方がばらつきが少ないので,標準偏差は少ない値になった.平均ではわからなかった差が見えた.これが分散や標準偏差が統計で使われている理由である.σ とは統計で,慣習的に標準偏差を示す文字である.
さて,平均というのは結構ごまかしができることはわかったかもしれない.もちろん平均は重要である.偏差値というのは平均とは違う性質を示す値であり,これらを上手く使うと便利である.








