統計学の書評を書くついでに、ふと思いたって本棚から引っ張り出したずいぶん古い本です。買ったのは30年くらい前のものでしょうか。出版に至っては1960年代です。たぶん今は表紙デザインが変わっているんじゃないかな。

ダレル・ハフ, 1968, 『統計でウソをつく法』, 講談社.

 

統計学では言わずと知れた名著であって、必読文献でもあります。というか、大学で統計を勉強する場合、まず確実に読まされます。それで買った本です。

 

統計でウソをつく法とありますが、別にウソをつくことを奨励しているわけではありません。今風にいうと、統計リテラシーのための本と言えるでしょうか。統計分析を行うにとっては、統計の正確性というか妥当性をどう確保するか(誤解を与えないためにはどうすればよいか)という問題や、倫理の問題(こういう分析や表現をやってはいけない)の参考書になりますし、統計レポートなどを読む側にとっては、統計にだまされないための視点を提供してくれる本です。

そういえば、昔、どこかの大学教授が『“子”のつく名前の女の子は頭がいい』なんて本を出していましたけど、うちの大学の教授は「疑似相関じゃないの?」の一言で済ませていました。曰く、①名前の流行は時代だけでなく、親の年齢にも関係がある(親の年齢によって子どもの名前に対する志向が異なる)、②子どもの学力は親の学力と一定程度相関がある、③高学歴の親は結婚や出産が遅れる傾向にある。だから、名前ではなくて、親の学歴が影響しているだけで名前が学力に影響しているわけではない、ということです。因果関係でいうと、

 親の学力 → 子どもの学力
 親の学力 → 子どもの名前

というひとつの原因に、ふたつの独立した結果があり、このふたつの結果に相関関係があるように見えてしまっているだけだ、ということです。当時、読む前にネタバレしてしまった感があるので、この本を買うのをやめた記憶があります(ボロアパートで本の重みで床が抜けそうだったこともあります)。

 

どこぞの大学教授の本だから、書いてある内容や調査結果が正しいわけではないということです。統計リテラシーがあれば、著者が大学の偉そうな教授であっても、その内容に疑いを持つことが出来ます。


もうひとつ、2012年の調査ですが、アホな調査がありました。「埼玉県の女性は貧乳が多い」というネット上にあった調査結果です。これです(ネットに結構落ちています)。

 

さすがに最初にこれを見たときは、「いったいどんな調査をやったらこんな結果が出るんだ」とあきれたものです。調査が悪いのか、分析がアホなのか、はたまた両方なのか。当時、テレビ番組が取り上げたので、結構有名になっていたかと思います。取り上げたといっても、ほとんど悪ノリしているとしか思えない取り上げ方だったみたいですが....。

 

考えてみるに、埼玉はAカップ、京都と岐阜はGカップ、って平均ではないよね。バストサイズは順位尺度なのか間隔尺度なのかによるけど、ここではカテゴリー変数として扱っていると推測されます。だから平均値を出しているわけではない。平均を出すとしたら、Aは1点、Bは2点というように点数を割り振って点数平均を出すことになるけど、その場合は、おおむね中間である2.5~3.5、つまりCあたりに収斂することになります。正規分布の場合は特にそうだし、A~Eが均等の場合でもそうなる可能性が高いです。

なので、このレポートでは最大値で割り出している可能性が高いと予想されます。つまり、選択肢A~Eで、どれが一番多かったかです。具体的にいうと調査の回答では

A+B+C+D+E=100%

となります。で埼玉と京都・岐阜を例に挙げると

埼玉   :A:B:C:D:E=21:20:20:20:19
京都・岐阜:A:B:C:D:E=19:20:20:20:21

という結果だったとしましょう。最大値をとると、埼玉は21でAが多く、京都・岐阜は21でEが多いとなるわけですが、この例だとどう見ても誤差の範囲です。検定をかけるのがあほらしいくらい一目瞭然です。実際のデータは見ていませんが、おそらくはこういう理由でこの結果の可能性が高いのではないでしょうか。つまり、単なる誤差で、大騒ぎしているに過ぎないわけです。ついでにいうと、まともな調査なら調査方法を明記するのですが(明記する項目もだいたい決まっている)、探しても見つかりませんでした(どこの調査会社なんだ、こんなアホな調査結果出したのは)。さらにいうと、この調査で話題を集めて味をしめたのか、2018年にも同じ調査をしていました。

調査する側からすれば、調査を読む側はこれくらいの知識を持っている、という想定でレポートを作るわけで、調査方法や分析手法を明記し、単に統計上の数字だけでなく論理的にも因果関係や擬似的ではない相関関係が存在することを示さなくてはならないわけです。実際には、出て欲しい因果関係は全く確認されず、説明につかない相関関係が出てきて「なんだこりゃ?」状態になったりするのですが。

でも、そういうリテラシーというか倫理は大切で、それを考えさせてくれる本だといえます。そういう意味でこの本は重要書扱いで、たぶん一度読んだだけなのだけど、未だに本棚に残してあります(大昔に一度読んだだけなので、実は何書いてあったっけ?状態ですが....)。