1.予備校・塾によって母集団が違うのか。
× どの場合も「母集団」は東大の受験者で、予備校が把握できるのは予備校の生徒と模試を受けた「標本(サンプル)」です。「母集団」という言葉の誤用です。標本から母集団を推定するのが、模試の判定です。母集団は常に同じです。
2.予備校の「標本」の性質が違うと、推定にずれが起こるのか。
× 標本の性質が違うことによって、推定のずれ「標本バイアス」はほとんど生じないでしょう。標本の性質ではなくて、実施する模試が東大の入試の問題と異なる性質によって起きる推定のずれ「標本の情報バイアス、模試バイアス」の方がずっと大きいはずです。さらに東大の入試の年度ごとのばらつき「入試間変動」は、たぶん同じ予備校・同じ時期に実施する模試のばらつきよりも大きいと思います。予備校の模試の受験者集団の特徴にはあまり影響を受けないでしょう。
3.模試ごとのA判定基準上の点数・偏差値(80%合格のポイント・ライン)の人の80%が合格して、20%が不合格になるのか。
△ 標本を用いて推定するので、本来は「推定誤差」があります。これを予備校は公表していません。しかし、ごの誤差よりも受験者本人の試験ごとのばらつき「個人内変動、試験間変動」のほうが大きいので、推定誤差は気にならないのかもしれません。つまり判定には推定誤差や個人内変動が考慮されていないのです。
4.受験者の多い東大模試の方が予測精度が高いのか。
△ 上記の3の推定誤差は模試受験者が多い(サンプルが大きい)方が、小さくなります「ランダム誤差」。しかし、もっと大事なのは推定するために必要な本番の東大の入試を受験した人の合格と不合格の結果(アウトカム)をどれだけ偏りなく集められるかにかかっています(アウトカムとして模試とは別に得る情報バイアス)。そして、合格も不合格の結果も、実際の入試の点数の分布「度数分布・ヒストグラム」からの偏りが分かっていないと予測精度は下がります。東大の判定よりも地方大学判定は合格・不合格の利用できるデータが少ないので、同じA判定でも予測の不確かさが増します。推定に利用した合格者・不合格の人数は答えていません。推定は実際の入試の結果の取得に依存するのです。
河合が公表するのは、アウトカムをある程度確実に得ることができているのだろうと想像します。駿台模試の受験者数は多いので、順位は参考になるのではないかと思います。
入試の時の体調もありそうですけど、これは集団の中では本番の入試結果に織り込み済みです。個人的には1年間数回の模試では予測できません。つまり予備校の模試の判定は、集団での予測で、個人の予測ではなく、集団の予測を個人にも当てはまるように見せているのです。うちの子は普段は強気ですが、意外と繊細で入試が二日もあると精神的に参ってしまいます。また感染症や生活リズムからのズレもうちの子は影響を受けます。
模試の予測の精度を高くするは望ましいわけでないです。性格、伸び率、科目のバランス、地域、そして天気、などを機会学習にでも入れると精度が上がるかもしれません。それでも、予測が非常に高確率になった世界は想像したくないです。判定は予測のような見た目をして、予測ではないです。
やっぱり適当なことを言っているのが幸せなんです。