献本などという恐れ多い経験をしたので、書評などという恐れ多い試みで御返ししたいと思います。

 

ある大学の先生と統計学の話になった時、こんなコメントをいただいたことがあります。

「君はp値の意味をみんな間違ってるっていうけど、僕は正直興味ないよ。統計学は道具なんだから、二つの群の間に差があることを”確実に”わかればいいんだって。」

 

どんな領域でも、何かを教えるときに情報の正確さと初学者のための伝えやすさをどう両立させるかというのは、大変に難しいのだろうと想像しますが、この傾向は「仕方なしに」勉強しなくてはいけない場合に一層顕著だろうと思います。そして多くの科学研究者にとって、「統計学」というのはまさに仕方なしに勉強する分野だろうと思います。

 

これまで統計学の教科書というと、「誰でもわかる!」「すぐ使える!」系のものと、背景理論の解説を徹底的に記述する数理系のものがありましたが、どの本も大抵どちらかに偏っていて、その中間に相当するような教科書が少なかったように思えます。例えば情報量基準に関する解説などが非常に顕著で、入門書で「AICは複雑すぎるモデルに罰則を課すんですよ!」と教えられて、「なぜ罰則の値がk=2なのか」とか「そもそもなぜ複雑すぎてはいけないのか」等もう少し詳しく知りたいと思うと、小西・北川「情報量基準」(2004)や下平・伊藤・久保川・竹内「モデル選択」(2004)に大ジャンプをする必要がありました。

 

当然、数理的な背景まで学んで「統計学のデータ分析はどんなことをやっているのか」わかった上で研究をできれば理想でしょう。しかし現実問題として、”統計学の研究”をやりたいわけでもないのに、小西・北川の数式を読解することに十分なコストを割けるか考えると、難しいように思えます。しかし一方で、「使えればいい」「結果が出れば良い」というスタンスでは、統計学に関して何か重要な部分を見失ってしまうようにも思えます。

 

そんな中、太字で「数学よりももっと大切なことがあるはずです」と堂々宣言して、これまでの入門書になかったアプローチを試みたのが、今回紹介する「統計思考の世界 曼荼羅で読み解くデータ解析の基礎」(著:三中信宏)です。タイトルだけみると訝しむ人もいるかもしれませんが、以下の英語の副題を見ると著者の本気度が伝わってきます:「An Introduction to Data Analysis and Abductive Inference」。Inductiveではなく、Deductiveでもなく、Abductiveなんだと言う辺り、科学哲学にも関心を持ってきた著者のこだわりではないでしょうか。

 

内容を見ると、大きく14講にわかれていることから、大学等の講義で使う事も念頭に置いたものだとわかります。しかし他の講義録の書籍化とは異なり、具体的な分析方法の解説に入る前の章に多くの紙面を割いているのが特徴的です。

統計的推論が、人間の行うその他の推論形式とどのような関係にあるのか自説を展開する第1章、あらゆるデータ分析の基本である「可視化」の重要性を強調する第2章、記述統計学と推測統計学の前史を紹介した第3章、アメリカ統計学会のp値声明を引き合いに出し、そもそも「データから”正しい答え”を出す方法」など存在しないのだ、という大前提を確認し、これを出発点としてFisherの有意性検定とNeyman-Pearsonの仮説検定の違い、R.Royallの尤度主義統計などの基本的な考え方を紹介する第4章など、普通の書籍では触れられていなかったり、せいぜい数パラグラフで終わらせるような内容にしっかりと紙面を割くことで「なぜ我々は統計学が必要なのか」「統計学で何がわかるのか(何がわからないのか)」を丁寧に解説しています。

 

また具体的な分析方法の解説においても、こうした基本的な概念の解説を重視する姿勢は変わりません。特に実験計画法に関しては7、8、9章と3章分を費やしており、データを得られた後にどう分析するのか考えるのではなく「そもそもどのようにデータを取るのか考えることが統計学である」、ということを重視する姿勢が伺えます。また上で引き合いに出したAICに関しても、「モデルとは何か」「尤度とは何か」から解説をスタートし、最大対数尤度と期待対数尤度の差がモデルのパラメータ数で近似切ることを非常に簡潔に説明しています。

 

このような本書の特徴をまとめるなら、表紙のキャッチコピーにある通り「広大な統計学の世界を俯瞰しよう!」という言葉がぴったりです。本書は数理統計の専門書ではなくデータ分析の入門書なので、ひとつひとつの説明に焦点を絞れば、情報の不正確さや議論のギャップがところどころ生じるのは仕方のないことです。しかし、「Rのコードを教えておしまい」「とにかく使えるようになるんだから、それ以上統計学のことを知っても無意味でしょ」というスタンスの入門書にはできない重要な説明が、本書のいたるところに散りばめられており、統計学の全体像を掴みやすくしてくれているように思えます。したがって学部や修士課程で初めて統計学に触れる学生だけでなく、なんとなくは理解したと思うが自信の無い人、やりたくもないのに統計学の講義を任されてしまった人、もう少し統計学を勉強してみたいが数学はゴメンな人、など多くの読者の手助けになるものと思われます。

 

5/18日に、すでに発売されたとのことです。みなさんぜひどうぞ。

三中信宏さま、どうもありがとうございました。