ビッグデータの利用シーンや統計学の考え方が、とても平易に紹介されています。

正規分布や仮説検定などの専門用語も多少出てきますが、数式もほとんど使われていないですし、それほど難しい話が展開されている訳ではありません。統計学やデータ分析にちょっと興味があるという方は、どんなもんか読んでみるのもアリだと思います。あるいは実際に統計学の勉強を始めた人が、学習に行き詰まったときにモチベーションを上げるためにお誂え向きかもしれません。

統計学に興味がある人もない人も、知って損になる話ではありません。

 

 

[目次]

はじめに

第1章 ビッグデータがビジネスを変える

第2章 おさえておきたい統計学

第3章 生活に役立つ統計学

第4章 統計データにだまされるな!

 

 

 

 

この本が上梓されたのは2014年だそうで、「ビッグデータ」という言葉が流行り始めた頃だったかと思います。かくいう自分も、この本を買ったのはその年でした。

その時代の本なので、一章ではまず「ビッグデータって何」「データサイエンティストってどうゆう仕事」的な話から始まって、SNS、検索履歴、コンビニ等での購買データなど具体的なビッグデータの例を挙げています。そこから、マーケティング、株価予想に景気動向、果てはワインの品質や映画がヒットするかどうかの指標など、ビッグデータの利用例が紹介されています。

  

二章が、この本の中では一番数学的、というか専門的な内容でした。統計学の基本的な考え方から、記述統計と推測統計の違い、そして正規分布・仮説検定・ベイズ統計など専門用語も多少出てきます。もっとも、数式や小難しい数学的理論が解説されているわけではないので、全体通してかなりあっさりと読めました。数学はちょっと苦手だっていう方でも大丈夫でしょう。ナイチンゲールやポアソン、フィッシャーなど統計学の偉人も何人か紹介されています。

  

三章では、より身近で使われている統計学の例が紹介されています。じゃんけん、あみだくじ、ギャンブルなどにおける確率・期待値の考え方。ほかには降水確率や平均寿命、テレビの視聴率など、よく耳にする統計データの話。降水確率と平均寿命の本当の定義は、自分はここではじめて知りました。AKB48メンバーとのじゃんけん勝負の話は面白かったですし、月並みですが「ギャンブルは損得で考えれば損だからやらない方がいい」というのは、まぁそうだろうなと思いました。ギャンブルはやればやるだけ損だけれど、それでもどうしても勝ちたいなら、期待値の高いギャンブルを狙って、早めに勝てたら後はさっさと勝ち逃げを決めた方がいい。という事らしいです。もっとも、この本の中でもツッコミが入っていたとおり、娯楽的な意味ではそれじゃつまらんのかもしれませんが。

この章は専門的な内容というより、全体通してトリビア的な色が強かった印象でした。

  

最後第四章は「統計データにだまされるな!」というテーマで、提示されたデータや結果が本当に信頼できるのかどうか疑うことが大事である、的な話が展開されています。

例として挙げられているのが貯蓄高の平均値は当てにならないという話。年収なんかもそうですが、これらは基本的に高い方に引っ張られる傾向があるので、この場合は平均値が当てにならず、どちらかと云えば「中央値」の方が実態を表しているとのことです。

また、それらのデータを集めるために様々な方法で調査が行われるわけですが、それらの調査を公平に偏りなく実施するのは殊の外難しいとのこと。加えて、調査の結果を誘導するために意図的に公平な調査を行わない場合もある。そんな趣旨の話が展開されています。じゃあちゃんとした調査かどうかどうやって見定めりゃいいんだよって話ですが、まあその辺に関しても若干示唆が与えられています。特にここ昨今は、毎日のようにいろんな数字や調査結果を目にする機会があるかと思いますし、疑わしいデータや調査も枚挙に暇がありません。それらが正しく行われた調査なのか、そこから得られる分析結果は本当に正しいのか、一通り読んだ後はそれらを多少疑うくらいの余裕は持てるのではないかと思います。

 

 

以上、全四章構成で、統計学やビッグデータの使われ方などをあっさり紹介しています。

すでに統計学を十分勉強していたり、仕事で日常的に使っていたりする方は、特に新しい知見が得られることは無いかもしれません。どちらかと云えば先にも述べたとおり、統計学を勉強したいと思っている方や絶賛学習中の方が、モチベーションを上げるような目的で読むのがいいんじゃないかと思います。ボリューム的にも200ページ強なので、全体的にトリビア的な感じでさらっと読めます。

 

 

読了:2021212