数週間前に職場で参加した、生徒の学業成績のデータから生徒の卒業する確率を予測するデータ分析モデルに関するプレゼンテーションについて。

このネタ、ブログで書こう書こうと思ってたんですが、ズルズル更新しなでいたのですが、私の働く学区が提携している、とある有名大学の教育研究組織のリサーチャーがプレゼンテーションを行いました。テーマが、

中学2年、3年、高校1年生の時点でのデータを使って、卒業できる見込みを予測する

という統計学を使ったデータ予測モデル。アメリカの生徒は、日本とは大違いで、義務教育の12年間を12年間で卒業するわけではなく、都市部の生徒では、貧困レベルの高い生徒が多く、卒業できない生徒が数多くいます。

*****
参考程度ですが、アメリカは2012年のデータで、卒業率が初めて80%を超えた 、というレベル。といっても、これはあくまで全体の平均で、人種別ではヒスパニック系が76%、黒人ではまだ68%。

さらに言うと、これは都市部も治安の良い郊外も両方含んるため、貧困層が多い都市部になるとまだ60%代で幾つかの都市部は50%代 だから驚き。

ちなみに私が働く学区は、思ったよりも多少ましで、2012-13年のデータで、卒業率が約71%・・・とあるサイトで公表されていたけど、多分これ実際はもう少し低いはず・・・。
*****

ポイントは卒業できない生徒を早い段階で発見し、事前に対処に卒業できるようにさせること。高校2年生くらいで卒業できなーーーいなんて分かってももう手遅れで、これをどれだけ早い段階で発見し、救済処置を行うか?が問題。

今回のプレゼンテーションは、中学生の段階で、データをあれこれ分析して早い段階で卒業できない可能性の高い生徒を発見する、そんなデータ分析モデルの初期段階のレポート。

簡単にこのデータ分析結果を(覚えている程度に)列挙すると、

1.生徒の学力テストスコアー


これは、州レベルのテストではなく、学区レベルで行っている英語と数学のテスト結果。

2.生徒の学業成績


アメリカでは多用される、GPAを使用。

3.欠席率(又は出席率)


言わずもがな、生徒の出席状況は、卒業率を予測する際に必要不可欠なデータ。

4.停学率

出席状況と同じくらい重要なデータ。

5.貧困率

アメリカのリサーチではお馴染み、Free-lunch(昼食無料)、Reduced-lunch(昼食減額)で生徒の貧困率もデータとして使用。

6.その他

その他としては、学校別、学年、人種などなど。

結果から言うと、8年生(中学2年)である程度は予測できた・・・というもの。つまり、欠席率や学業成績がある一定の基準値を満たしていない場合、統計学上卒業できない可能性が高くなる、ということが分析によって明らかになった、というもの。

だた・・・、問題が大いにあって、このリサーチの問題は、

データ分析モデルで必要なデータを全て含む生徒は、実際に学区にいる生徒の約3割しかいなかった・・・

というもの。これってどういうことか?というと、

アメリカの都市部の生徒は、中高レベルでいっきに生活態度や学習状況が変わります。

中学2年でDropout(落第)して、数年後に再度学校に通い始めた

違う学区や州から転校してきた

学力テストを継続して受けていなかった


などなど、問題があるのです。

学力テストは最近も違う目的でデータ分析しているので今ある意味かなり詳しいのですが、私の働く学区では(以前にお伝えしたと思いますが)一年に三回(Beginning of year、Middle of year、End of year)の三回行い、三回とも生徒が受けているとは限りません

生徒が欠席していて受けてなかった、学校側が受けさせずに授業を行っていた(←信じられないかもしれませんが、州レベルのテストと異なり、学区規模のテストでは学校側がなんと無視してテストを受けていないということがあるのです・・・)なーんてことがあるため、3回ともテストを受けていて、学区外に転校していない・・・など全ての条件を満たす生徒になると、全体の3割の生徒まで減少します・・・。

というわけで、あくまで条件が満たされた生徒のみなので、その条件に合わない、つまりテストをきっちり受けていない生徒(←ある意味、この生徒が卒業できない可能性が高いのですが)がデータ分析に含まれていないのです。

というわけで、ある意味このリサーチ結果は参考にはなるが、実際の政策に活用できるか?というと、答えはNOという結果です。

<総評>

今回のリサーチレポート、ある意味興味深く、プレゼンの際には、学区内の各部署のトップが集結し、学区のトップであるSuperintendent(教育長)も参加していました。私個人としては質問がしたくてもできない立場だったのでしませんでしたが、ぶっちゃけ、

卒業率(Graduation rate)よりも、今はCollege-readinessの割合でリサーチする方が流行り

と正直な感想。卒業率を上げることはもちろん重要ですが、それ以上にCollege-readiness(大学で勉強する学力を身につけているか?)の方が重要で、学力を上げれば(早い話)卒業率など自然と上がります。

個人的には、卒業できない生徒を早い段階で見つけるデータ分析モデルより、どの段階で学力が上がらず、授業についていけずに落ちこぼれていくかを見つけるデータ分析モデルの方が、College-readinessにも役立つし、学力向上にも役立つのに・・・と個人的に思いました(と同時に、そのモデルを構築するデータが学区に全てあるのか?という問題もありますが・・・)。

というわけで、こんな感じで都市部内の学区の生徒はまだまだ卒業率は低い、苦悩の日々は続きます・・・。