”フェルミ推定”について興味をもったときに知った書籍です。ある程度理想的に考えたり単純化して考えたりしながらも、結論に突き進んでいく。それがなんとも爽快で是非読んでほしい本です。

 

特に「双子が同じ日に交通事故でなくなったことは奇跡的なことなのか?」という内容の推定なんですが、最終的に30%として起こりうるという結論にありついたのは驚きと興奮を覚えました。その章は、是非とも読んでみて味わってほしいです。

 

以下は、その文章ではないですが、標本抽出についての文章の抜粋です。

自分の知っている単語の数を知りたいと思ったことはありますが、その方法を考えるという思考の流れは面白いですし、この本のさわりにはなるかと。

 

「僕たちが知っている単語の数をどうやって数えればいい?統計的サンプリングの考え方」

読んで理解できるボキャブラリーの数を割り出すことは可能だ。いちばん簡単なのは辞書のすべての項目をチェックして意味を知っている単語を数える方法。しかし、そんなことをやっていると日が暮れてしまう。

辞書をランダムに100回開いて、サンプルとなる単語を採取する。辞書を開くたびに、ページの先頭に載っている単語を見てほしい。その単語の意味を知っているだろうか? 知っていれば得点に1点をプラス。最後に、自分の得点をサンプルの数の100で割って、意味を知っていた単語の割合を計算する。この割合に、辞書に載っている単語の数を掛ければ、自分が理解できるボキャブラリーのだいたいの数がわかる。

1回目の単語の意味は知っているが、2回目の単語の意味を知らなかったとする。そうすると、ほんのわずかしか調べていないのに、辞書の適切な結果を得るためには、単語の半分を知っていることになる。だけど、常識で考えてみれば、このような推測値はあてにならない。僕たちが辞書の単語の半分を知っている可能性はゼロとはいえない。しかし、僕たちが知っているのは、すべての単語の1割だけかもしれないし、9割の単語を知っているのかもしれない。たまたま辞書で目にした単語が、ごくたまにしか使われない単語かもしれないし、とてもよく使われる単語かもしれない。その辞書にどれだけ多くの単語が収録されているとしても、そこから2つ選んだだけではサンプルとして使い物にならない。

10回試してみれば、信頼性はぐんと高くなる。100回なら、もっといい結果が得られる。1 ,000回試してみて意味がわかる単語の数が500だったときには、「僕は辞書に載っている単語の半分を知っている」と胸を張ってもいいだろう。辞書に載っている単語の数も知っておく必要がある。でも、できれば単語の数を数えたくはない。どうすればいいだろう?これはとっても簡単。辞書の最後が何ページなのかを見て、これを辞書のページ数とする。次に、ランダムに辞書を開いてそのページに載っている単語の数を数える。辞書のページ数と1ページあたりの単語数を掛ければ、辞書に載っているすべての単語数を概算できる。