前回のブログで紹介した、コースと偏差値の関係計算システム、少しだけ改善しました。
あと、以前作成したコース在籍確率システム、放置していたら、いつの間にかリンクが切れていました。別サーバにアップします。
在籍確率は、各校舎のレベルが一律として、超幾何分布を利用して計算しています。大分以前に、各校舎のコース基準点を集計したときに、校舎毎の基準点の違いが統計的なばらつきによるものか、本質的なレベルの違いによるものか検証した際に作成したものです。当たり前ですが、現実を完全に再現するものではありません。偏差値との関係と同様、目安とお考えください。
ちなみに、超幾何分布というと大げさですが、エクセルに関数があるので以下で簡単に計算できます。google spreadsheetでもできるかと思います。
HYPGEOM.DIST(狙う校舎の順位,校舎の人数,全体順位,全体人数,true)
ただ、順位や人数に自分を含めるべき否かが迷うところで、上記のサイトでの計算では以下のように考え含めていません。
(1)自分以外の全体人数から、自分以外の校舎の人数分を無作為サンプリングする
(2)サンプリングされた中で、自分より上の点数の人が(全体順位が自分より上の人が)、自分の狙う順位より少なくなる確率を求める(点数が上の人が少なければ、狙う順位(コース)に在籍できる)
含める、含めないで、計算結果にそれほどの違いはないですが、どちらが正しい考えかは興味あります。間違い等指摘していただけると嬉しいです。数年来悩んでいたので。