まあ、予想はしてたけど、ビリー アイリッシュが主要4部門すべてとっちゃいましたね。去年、よく聴いたのがトッケビのサントラとビリーの曲。彼女の曲はなんか新しい感じがしますね。

 

グラミーの受賞式は個人的にはH.E.R. のパフォーマンスが良かったですね。ストリーミングでしか売ってないのが彼女の今回の2ndアルバム、去年に引き続き、またAlbun Of The Year にノミネートかつ今年もパフォーマンス、1stアルバムは結構最近聴いてて、落ちつく感じ、アリシアキーズの再来と言われる彼女、今回はエレキギターも披露してこれもうまかった。ことしも司会はそのアリシアで最初にコービー・ブライアント氏が1月26日、ヘリコプター事故で亡くなったことに触れてましたね。

完全にビリー・ナイトかな。史上最年小で女性初で主要4部門制覇(史上2回目) 日本に9月に横浜アリーナにくるとか、なんかさらに世界的に騒がれますね。007のNo Time To Die  も好きです。

https://www.ism.ac.jp/editsec/toukei/pdf/57-1-119.pdf

 

生存時間解析って難しいですね。前にアップした論文を見ていると、ある事柄のあるなしのハザード比を書いてその区間(信頼区間)の記述の後でp値が書いてあります。 この記述が謎でした。比例ハザードモデルは基準ハザード関数にいろんな特性があるなしの変数z_i (多分0または1)それとそれが与える影響の係数β_iの一次結合を指数関数の肩にのっけたものと、混合のパラメータw_jの積です。

だからβ_iの値が知りたいとき、z_iの値を0と1にしたもので比をとってあげれば、他の部分は相殺されて、β_iだけ残る(実際はe^{β_i} だけど煩雑なので略してβ_i と表します)。これが1を信頼区間に含んでいれば、その特性は死ぬ確率に影響しないということに、ただ、前回書いたベイズ統計でMCMCならp値って出て来ようがない。従って、β_i の従う確率分布が数学的にわかっている状況があるということです。

すべてのβ_i たちのつくるベクトルが従う確率分布として部分尤度を計算する部分があってこれは、例えば t1  t2  t3, ....    とあるきまった時刻に誰かが死ぬという(なんかサスペンスかオカルトみたい(^^;)  前提で条件付き確率として 調査で実際の起こった内容の条件付き確率の分布関数は漸近正規性をもつことや 別の確率過程で解釈できてマルチンゲールの議論など使えるといってるのが最初に書いた論文のよう。

 

ある事柄あるかないかは、観測データが1か0でしょう、その観測データには係数がついていて、この係数がどれだけかを見ているわけです。

 

比例ハザードモデルはある時間tに特定の人が死ぬ その人の特性で0か1 それといくつか混合モデルための係数がかかっている 0か1を入れたとき出てくるのはその人がその時刻に亡くなる確率

 

亡くなるということが主的アウトカムかな  心筋梗塞などの特定の疾患が発症するのが副次的アウトカムとあるけど、後者はどういう扱いを数式でやっているのかがまだ見えない。

 

 

とりあえず、β_iの従う確率分布がわかって、その信頼区間をp値付きでこれでもとめてる。

だから、結構めんどいですね。その意味では栄養素のバランスを問題にしたいけど、作業仮説として一つの栄養素の成分比の大きさを群に分けて、比較するために比をとるしかない。

 

β_iたちをまとめ推定するにはベクトルになるから、多分大変なんでしょうね。。

 

まだ、わかんないとこあるけど、いちようわかったこと。生存時間解析って長ーい歴史がありそうで、じっさい臓器移植やいろんなところで、どうしたらなるべく死亡者を少なくできるかの実際問題とかかわって出てきた統計だけに、切実でその歴史がありますね。なかなか煩雑

Pythonに慣れるのに、普通の人は、それほどクラスを自分で作ることはないと思う。人の作ったクラスを使うことはあっても、まずは自分で作る話は、普通、データ解析では見られない。

本当にそれをするには、いつも使ってるライブラリーのソースを読むのが一番だけど、これは一筋縄ではいきません。

そこでまずデータ解析に使える程度の話に絞るなら、次の本がいいかなぁって思います。基本的にJupyter notebook に慣れることになりますが。

Pythonでわかる確率論入門ー確率空間からカルマンフィルタまで

 

この本の良い点は、サンプルコードはGitHubに置かれてて、Jupyter notebook で書かれてます。

例えば

https://github.com/ktysd/prob-tut/blob/master/Jupyter/Ch04.ipynb

 

を見てもらえばわかりますがGitHubはJupyter notebook の出力そのままを見られます。従って自分で実行しなくてもコードの結果を見ることができます。

 

内容は統計学を勉強するには、必要な内容といえます。普通の統計学の本ではまず扱ってないただし、数理統計学では、きちんと行う、確率空間、確率変数とかを例で説明しています。確率変数とは確率空間から実数への可測関数ですから、その変数が確率分布に従うとはどういうことかもきちんとわかると思います。それと確率過程の話は、今日のベイズ統計が当たり前になっている時代では、避けては通れません。時系列の統計学を扱う際にも基礎的な概念を提供し、かつその具体例をPythonを使いながら学ぼうとする際に関数や配列、グラフなどを具体的に表示させていく中でデータ解析に必要なPythonの扱い方(ただし統計のパッケージを扱うわけではないので、そこは今度はそういう本を見れば、コード自体は難なく読めるようになってるはずだろうと考えてます。)

 

多分、数学から離れてる方や文系の方にとって集合の扱いは不慣れでしょう、σ代数とか出てきますが、その具体例をPython を使って、具体的に学べるので、非常に良いと思います。