信念は移りにけりないたづらに:STAP細胞が存在する確率って何%だと思いますか? | Pull Myself up by My Bootstraps!

Pull Myself up by My Bootstraps!

タイトルは、統計学におけるBootstrap(現実のデータを基に、
現実と異なるショックが起きた場合のデータの振る舞いを分析する方法)の語源
「自分のブーツの紐を引っ張って足を上げる」→自分の置かれた環境を自分の努力で変える、という意味です。

**********

(注)以下、STAP細胞が実在するかどうかの議論とは直接関係ありません。最初のニュース、その後の再現実験に失敗したという報告等に接して、人々の見る目が変わってしまうことについての投稿です。

**********


みなさんは、以下の「確率」について、どのように考えますか?


++++++++++

1.財布の中に入っている10円玉を投げて「表」が出る「確率」

2.火星に生物が存在する「確率」

++++++++++


1.は繰り返し試行を行うことができるのに対して、2.は実際のところは 「真実はひとつ」 であって、存在する/存在しない のどちらかしかありません。


1.のように繰り返し試行が可能な事象について、頻度に基づいてその事象の「確からしさ」を数量化する考え方を古典的確率論と呼びます。


これに対し、2.のように真実は一つしかないのだけれども、その真実そのものを確かめることができないために、観察された事実を基に事象の「確からしさ」について人々がもつ「信念の程度」を数量化する考え方をベイズ確率論と呼びます。


例えば、決定的な検証がなされていない今の状況の下で


・STAP細胞が本当に存在する確率は何%だと思いますか?


という質問に対する答えなどは、ベイズ確率論の考え方に基づく確率概念だと言えるでしょう。


このベイズ確率論に基づく推論の面白いところは、観察されたデータの影響を受けて、人々の「信念」がアップデートされる様子を分析する点です。


ここで、STAPの考え方が初めて発表されたとき、「弱酸性の刺激によって幹細胞の発生が惹起される」という着想に対して、それが真実かどうかについての人々の信念が半々だったとしましょう。


・P (A) = 0.5 (A:STAP細胞は本当に存在する)


・P (B) = 0.5 (B:STAP細胞は存在しない)


で、本当に弱酸性の刺激だけで幹細胞が作成されるのかどうかについての実験が行われるわけですが、この実験は成功することも失敗することもあります


ただし。


・STAP細胞が本当に存在する(A)のだとすれば、90%の確率で幹細胞が発生(x): P(x | A) = 0.90


・STAP細胞が存在しない(B)のだとすれば、弱酸性の刺激を与えても幹細胞は発生しないが、実験過程でES細胞など別の幹細胞が混入し、結果的に幹細胞を得る確率が10%: P (x | B) = 0.10


であるとします。すると、STAP細胞の真偽如何に関わらず、実験を通じて幹細胞を得る確率は


・ P (x) = P (x | A) P (A) + P (x | B) P (B) = 0.90*0.50 + 0.10*0.50 = 0.5 (50%)


となります。


いまここで、ある研究者が1回の実験で幹細胞の生成に成功したとします。 すると、条件付き確率に関するベイズの定理を使って、実験結果を考慮した上でのSTAP細胞の存否に関する人々の信念は以下のように改定されます。


【実験結果xを観察した後、STAP細胞が存在する確率】

・ P (A | x) = P (A∧x) / P (x) = P (x | A) P (A) / P (x) = 0.45 / 0.50 = 0.90 (90%)


【実験結果xを観察した後、STAP細胞が存在しない確率】

・ P (B | x) = P (B∧x) / P (x) = P (x | B) P (B) / P (x) = 0.05 / 0.50 = 0.10 (10%)


したがって、実験前は半信半疑だった人々が、「実験が成功した!」という結果を見た後には、「90%の確率でSTAP細胞は存在する」との信念を抱くようになるわけです。


ところが、研究者が5回実験を行い、そのうち1回だけ幹細胞の生成に成功(y)したとします。 STAP細胞が存在する(A)、存在しない(B)というそれぞれの事象の下で、5回中1回だけ実験が成功する確率は


・ P (y | A) = 5 * (0.90^1) * (0.10^4) = 0.00045 (0.045%)


・ P (y | B) = 5 * (0.10^1) * (0.90^4) = 0.32805 (32.8%)


そして、STAP細胞の真偽如何に関わらず、5回中1回だけ実験が成功する確率は


・ P (y) = P (y | A) P (A) + P (y | B) P (B) = 0.00045*0.50 + 0.32805*0.50 = 0.16425 (16.4%)


となります。この実験結果を見た後の人々の信念はどうなるでしょうか。


【実験結果yを観察した後、STAP細胞が存在する確率】

・ P (A | y) = P (A∧y) / P (y) = P (y | A) P (A) / P (y) = 0.00045*0.5 / 0.16425 = 0.00137 (0.14%)


【実験結果yを観察した後、STAP細胞が存在しない確率】

・ P (B | y) = P (B∧y) / P (y) = P (y | B) P (B) / P (y) = 0.32805*0.5 / 0.16425 = 0.99863 (99.86%) 


実験失敗の報告が重なることで、実験前は半々の確率でSTAP細胞は実在するんじゃないかと思っていた人々の信念が揺らぎ、「99.9%STAP細胞は存在しない」と考えるようになりました


逆に5回中4回実験に成功すれば、まったく逆の結果になります。


もちろん、以上の計算結果は 


・ 「STAP細胞が本当に存在するとした場合に実験が成功する確率」


・ 「STAP細胞が実は存在しないのにアクシデントで実験が成功する確率」


について、便宜的な仮定を置いた上で得られたものであって、細胞生物学の知見をもたない自分には、STAP細胞の実在性を議論する意図はありません。


ただ、「STAP細胞は実在する」 これが真実だとしても、実験結果次第で人々の信念は大きく変わってしまうので、今後の再現実験の結果がどうなるかによって、議論の風向きが大きく変わることもありうると思っています。