eclipseのブログ -98ページ目

アカデミー賞のサプライズ

アカデミー賞、パラサイトが受賞したのは、途中から予測できたけど、一番のサプライズは、映画に音楽が欠かせないと色んな場面の動画と曲がかかって最後に8mile　でエミネムが、舞台に現れて、Lose Yourself　を　歌い出すのにはびっくり。

会場もびっくりしてましたが、途中からかなりの人が一緒に口ずさんでノリノリの感じ、まああの曲は有名ですからね。

でもなんで？　今年の歌曲賞はロッケトマン（エルトン・ジョンの自伝映画）でエルトンの曲が受賞しましたが、そのパフォーマンスで、彼自身が。
おそらくそれと関係があるのでは？　グラミー賞でStanのコラボを二人でやって、その後もエミネムが薬から立ち直るのに病院に入れたのはエルトンですから、きっと自分が出るのに彼も出さないととか駄々こねたかな。

とはいえ、なんか、エミネムは先月サプライズ・リリースしたニュー・アルバム『ミュージック・トゥ・ビー・マーダード・バイ』で、米ビルボード・アルバム・チャート“Billboard 200”で10作連続初登場1位の快挙を成し遂げているとか。

本の紹介　　２冊

瀕死の統計学を救え！ ―有意性検定から「仮説が正しい確率」へ―　豊田秀樹著
http://www.asakura.co.jp/books/isbn/978-4-254-12255-8/

［カバー序文］（引用）

2019年3月，統計学に関する2つの衝撃的な論文が公刊されました．1つはアメリカ統計学会監修 The American Statistician の「21世紀の統計的推論：“p < 0.05”を超えて」です．本論の章タイトルは，Don't Say“Statistically Significant” であり，命令形ではっきりと有意性検定を禁止しています．これ以上 p 値を使い続けるということは，最大手の製造元メーカーがリコールし，乗車を禁止している車に乗るのといっしょです．もう1つは，権威ある科学雑誌 Nature の「統計的有意性を引退させよう」です．このコメント論文には800人以上の科学者が賛成の署名をしており，「統計的有意性の概念全体を放棄するように求める」と主張しています．今後も p 値を教え続けるということは，最大手の消費者団体が乗車を控えるようにと呼び掛け
ている車に乗れ，と言うのと同じです．それでもあなたは p 値を使い続けますか？まだ有意性検定を教え続けますか？

あと

https://gihyo.jp/book/2019/978-4-297-10723-9
圏論の道案内

この本の概要（引用）
圏論は最近人気がある数学の分野の１つで，その考え方はプログラミング，人工知能，物理など幅広い分野に応用されています。本書はそんな圏論を一から知りたい人に，圏論とは何かをわかりやすく解説していきます。異なるものをどうやってつなげて矢印を引き，同じようなものとして見立てていくか，その過程をじっくり味わってみてください。自ずと，圏論とはそういうことだったのか，とお分かりいただけるはずです。
ーーーーーーーーーーーーーーーーーーーーーーーーーーーーーーーーーーーーー

個人的には、特に、文系の方で数学が苦手な方に読んでもらいたいです。圏論が数学の分野というよりも、色んな分野の言葉になってると言った方が正しいでしょうけど、高校までの嫌いになった数学とは、別世界の数学があると思いますし、また役に立つと思います。

有意性検定の問題点

放送大学の「心理統計法」（１７）　から　まとめてみました。まあすこし自分なりに補足しながらですが、大体こんな感じにまとまるのかな。正直、いまでも統計の初歩の本はT検定や分散分析を有意性検定でｐ値使って書いてる本がほとんどなので、ちょっと胸が痛みます。すべての主張を数式で追ってるわけではないので、あしからず、また統計は数学と違って、解釈が入ってくるのでやっかいです（数学に解釈が入ってこないと言ってるわけではなくて、数学も解釈ですが、なんか別物のような）

１．有意性検定は、違いを主張したいのに、背理法で等しいと仮定して、ある統計量を計算してその値が確率的に起こりえないと主張して、矛盾といって違いを主張する。この起こりえない確率がｐ値ですが　まずサンプルサイズが大きくなれば、ｐ値はいくらでも小さくできる。だからビックデータではいつでも有意になって違いが主張できるが、これは等しいという仮定で出発したので、数学的に等しいは、完全に等しいなので　仮に１０億分の１の違いでも数学的には違うことになる。つまり現実の世界では、二つのものが数学的な意味で等しいということは、まずない。つまり、結局はサンプルサイズの大きさで、その違いを誤差のブレとみるか本質的な違いと見るかを決定していることになる。

１．の補足　MCMC法の場合は、サンプルサイズが大きくなれば、差がある値を超える確率は０か１に近づく。ベイズ更新で頻度論的な世界に近づくと考えると、背理法を使ってない議論なので、変なことは起きないということでしょうか。

２.　１にも関係するが、違いが認められても、どれだけ違うかは述べられない。これに反し、ベイズ流のアプローチでは、差がこれだけの時の確率が具体的に求まる。

３. 背理法的議論は　複雑で特にｐ値の解釈は誤解されやすい。また背理法的議論は、それぞれの結果を組み合わせる時、誤解を生じやすく間違いを犯しやすい。

4.　1におけるサンプルサイズを予め決めて、差を見積もる検定力分析とかあるが、これは方法論が確率分布に依存するため、一般化しにくい、なお一般化はどうしても確率分布を積分して積分値を求めないといけないので、高度な数学が要求され、またいびつに既知の確率分布関数に帰着させるため議論が複雑、難解。

５.　４に関係して、初歩的な統計学しか検定は出てこない、高度な統計は、それだけ確率分布がが複雑になり漸近正則性や確率過程などの確率論の高度の理論を屈指して数学的に確率分布関数をもとめたり積分したりとなって、それも限界が来て、結局は一般化線形モデルおよびその混合版は、最尤推定はできなくて、かわりMCMC法を用いて事後確率を計算することになる。あるいは推定や予想の方に問題意識がシフトする。

６. 15回で言われるように、初等的な統計しか有意性検定は使われない、そのくせ難解で暗記を強いる。あと一般化線形モデルなどで尤度がでてきてもこれも暗記になる。それよりかベイズ的アプローチで事後確率を学んだ方が尤度と直接関わっていて、しかもその確率分布を求めるマルコフ過程やそれ使ったMCMC法はどれも同じであって、そこはStanがやってくれて、やり方をとりあえず覚えればよいので、統一的に学べて、変な暗記を強いられずに理論を学べるので有意性検定を排除して、ベイズ的に最初からやったほうが教育的である

アカデミー賞のサプライズ

本の紹介 ２冊

有意性検定の問題点

本の紹介　　２冊