統計学における意思決定理論文献まとめ

頻度主義：

Neyman, J. and Pearson, E. (1933). The testing of statistical hypotheses in relation to probabilities a priori.

Proc. Cambridge Philos. Soc., 24 492–510.

・古典中の古典

Wald, A. (1949). Statistical decision functions. The Annals of Mathematical Statistics, 165-205.

尤度比検定などで知られるWaldは（悪い意味で）頻度主義におけるdecision makingの代表的論者だが、シチュエーションによっては積極的に事前確率を用いることを考えていたようで興味深い。他にも実験の打ち切り条件に関する研究など見ると、Waldは科学的推論のための統計学というより軍や企業などがとにかく効率よく意思決定することに関心を置いていたのかもしれない。

Mayo, D. and Cox, D. (2006). Frequentist statistics as a theory of inductive inference. In Optimality: The Second

Erich L. Lehmann Symposium (J. Rojo, ed.). Lecture Notes-Monograph Series, Institute of Mathematical

Statistics, Beachwood, Ohio, USA, 77–97.

未読。Mayoは現代の「統計学の哲学」において頻度主義の代表的論者だが、普段提唱しているエラー統計の考え方はdecision makingとは少し離れているため、どのような主張を展開しているのか興味深い。

ベイズ主義：

Berger, J. and Sellke, T. (1987). Testing a point-null hypothesis: the irreconcilability of significance levels and evidence (with discussion). J. American Statist. Assoc., 82 112–122.

忘れた。

Casella, G. and Berger, R. (1987). Reconciling Bayesian and frequentist evidence in the one-sided testing problem. J. American Statist. Assoc., 82 106–111.

p-valueを帰無仮説に対する事後確率として捉えるのは誤りである。しかし、サンプリングサイズが小さい片側検定の場合は、近似的に事後確率として解釈しうる、みたいな話だったはず。

Berger, J. (2003). Could Fisher, Jeffreys and Neyman have agreed on testing? Statistical Science, 18 1–32.

フィッシャーの優位性検定、ネイマンーピアソンの仮説検定、そしてベイズファクターによる検定を比較検討したのち、各流派の検定を折衷したCEP (条件付きエラー確率)という概念を提唱する。途中、p-valueをエラー確率として誤解するとどれぐらい深刻な誤りをもたらすのか説明するために行ったというコンピュターシミュレーションの例など面白い。

尤度主義：

？？？？

Royall(1997)などは、ある種のdecision-making ruleとして捉えることができるかもしれない。ただし、尤度主義そのものというよりは、尤度主義的な方法を「活用して」という言い方にしないと、尤度主義の強みである徹底した客観性という側面が損なわれるかもしれない。

今月末の招待講演（！？）は、このあたりの話を整理する予定。