前回のつづき
合格者数のダブルカウント(重複)を
なるべく修正したい
そうすれば、
合格を狙える塾内での順位についても、
現実的な値が見えてくる?
問題点の洗い出し
既に、
四谷大塚には早稲アカと臨海セミナーが含まれていることが分かっている。
さらに、
早稲アカのサイトでは、合格実績に以下の記載がある。
早稲田アカデミーグループ
(早稲田アカデミー、SPICA、早稲田アカデミー個別進学館、水戸アカデミー、QUARD、早稲田アカデミー海外校)
つまり、
早稲アカの合格者数は、グループ全体の数値ということだ。
このうち、
SPICAは予習シリーズを使っていないようなので、四谷大塚の値には入らないはず。また、個別進学館では全てではないが予習シリーズを使うとの記載があるため、四谷大塚の値に入れる。水戸、QUARDは御三家実績を確認できず。
よって、
ダブルカウントを除くために、以下のようにデータ修正をする。
早稲アカの数値から、SPICAと個別進学館を除く。さらに、引いた後の早稲アカと個別進学館を四谷大塚から引く。また、その四谷大塚から臨海セミナーも引く。
塾別男子御三家合格者数(補正1)途中経過
結果を表にまとめた。
早稲アカの値は問題なさそうだが、四谷大塚の麻布と武蔵がマイナスだ
四谷大塚さん、この不可解な値、
どうやって集計したのですか?
追記:コメント欄にご指摘を頂きました。
早稲アカのNNが原因のようです
人数不明のため修正できずすみません。ご指摘頂いた特待やスカラのうちNN分はこれに含まれますが、通常カリキュラムの分は補正で対応しています。臨海は、予習を使わない特待分があれば四谷大塚に足し上げですが、もともと人数が少ないので、この影響は小さいと思われます。
やむを得ず、四谷大塚の麻布と武蔵は「エラー」とする。
ただし、四谷大塚の開成には、意味がありそうな値が出ている。
なお、
このように修正しても
開成にはまだ117人の重複(ダブルカウント)がある。
これは、塾の掛け持ちによるものか?
しかし、このデータを通常データと等しく評価してよいだろうか?
二つの塾の力で合格に到達するのだから、効果は按分されるべきでは??
やはり、修正してみようかな。
なお、塾間の重複関係は調べられないため、係数を使って補正することにした。
塾別男子御三家合格者数(補正2)
塾の掛け持ち効果を
それぞれ修正した値
※ 四谷大塚はデータ不明のため算出できず。NNが影響しているようです。
これで、分かっている範囲の重複はなし。過大評価もなし。
開成合格だと、男子でSAPIX221位、早稲アカ51位、日能研34位、浜学園20位、Gnoble12位以内が現実的な順位。
なお、
SAPIXと早稲アカ、日能研(関東圏)の在籍者数と、浜学園(関東圏)Gnobleの在籍者数の水準を勘案すれば、いろいろと見えてくる。
各塾の中で、御三家を狙える順位として、ある程度の指針となるかな。
データの制約があるため、仮定はあるが。
本来なら、
塾の強さを比較するには、
受験者数を用いて合格率を出す必要がある。わたしの知る限り、各塾は受験者数も合格率も出していない。
本当は、これが知りたいんだよね。
塾は出そうとしないけれど。
「ねえ、ゆうく、この順位は厳しいね。」
「そうだね。」
「これ、どう思う?」
「別に。」
「何とも思わないの?」
「うん。」
「どうして??」
「それはね、ママ、
今考えても、意味がないよみんなこれから全力で頑張るんだから!」
「なるほど。ゆうく、現実的ね。」
「ぼくも頑張るけどね。」
気になったからやってみたけど、
考えるのはもっと後にしよう。
おわり
参考記事