全米規模で行われているテスト・NAEPと各州政府が州規模で行っているテストの習熟度達成者の割合を比較した記事&レポートについて。

Common-Core Backers Hit States' High Proficiency Rates

Proficient vs Prepared

アメリカのK-12(小学1年生から高校3年生)の教育情報を伝えるEducation Weekの記事を今日は紹介しますが、今日の記事、結論から言うと、少々間違ってます!!・・・というわけで、何がどのように間違った伝え方をされているかを説明することで、アメリカの教育の問題を考えたいと思います。

<全米共通テスト(NAEP)>

アメリカでは全米共通学力テストと言えば、PARCCやSmarter Balancedの2つがこの2014-154年度から始まりましたが、全米規模のテストは、元々NAEP(National Assessment of Educational Progress)というテストがずーと前から(1969年から)行われていました。

このNAEPは全米規模で行われていますが、この目的は全米規模で学力の推移を測定しようという目的で、アメリカ連邦政府の教育省が実施し、このテストのみ全州で実施されています。

ただ、学力の推移を測ることが目的であるため、全米規模とはいえ、各州の全生徒が受けるわけでなく、小学4年生と8年生のみ。さらに統計学上必要と言われる数の生徒だけが受けている、サンプルデータです。

今回の記事はこのNAEPのテストで、Proficiencyレベル(習熟度)に達している数値が、各州が州規模で実施しているテストでProficiencyレベルに達している数値とどう違うか?について、報告された記事とそのレポートについてです。

<Proficiency(習熟度)の違い>

このProficiencyレベル。各学年で定められた学習内容を学んだと判断する際に用いられる、アメリカである意味最も重要な指標の一つで、このProficiencyレベルに達している生徒の割合を増やすことが、あの、No Child Left Behindでも要求されています。

今回、ワシントンDCにある非営利の組織がこのNEAPでProficiencyレベルに達している割合と、州規模で行われているテストでのProficiencyレベルに達している割合を単純比較し、それをレポートとして公開しています。

比較されているのは、2013-14年度の小学4年生と8年生(中学2年生)の数学と英語のテスト結果。下記に載せたのは、4年生のReading(英語)のNEAPと州規模のテスト結果における、Proficiencyレベルに達した割合がどれだけ違うかを示しています。

左側に各州政府が列挙され、グレーの線が州規模のテストにおけるProficiencyレベルに達した生徒の割合、青線がNEAPでの割合で、右側に割合がどれだけ違うか数値に示しています。

筆頭のGerogia州は、-60ということで、州規模テストの割合がNEAPの割合よりも60%も高い、ということを意味しています(つまり、違いがかなりある)。

NEAP

この結果によると、唯一州規模のテストの方がProficiencyレベルに達した生徒の割合が高いのは、一番下のニューヨーク州のみ・・・となります。レポートには、英語、数学の4年生&中学二年生それぞれ、NEAPのProficiencyレベルよりも州規模の割合の方が高い州、低い州をそれぞれ結果として報告しています。

<誤ったデータ比較>

問題はこの単純はProficiencyレベルに達した割合の比較結果。

リンク先のレポート結果で、NEAPの結果と州規模の結果は往々にしてかなり異なる(Significantly different)と報告してますが、この分析結果が(はっきりいうと)結構間違っています。具体的に説明すると、レポートには、

Too many states are saying students are "proficient" when they are not actually prepared.
(学生が事実上(大学で勉強するだけの)準備ができていないにもかかわらず、“習熟度に達している”と判断している州が多過ぎる)

Many states continue to mislead the public about whether students are proficient.
(学生が習熟度に達しているかどうかに対して、多くの州が公的に誤った情報を流し続けている)

と、NEAPの示すProficiencyレベルの割合が習熟度が正しく、州規模の示す割合が間違っているという前提での分析結果、並びに結論です。

確かに・・・・・・・・・・です。州規模のテストは、

1.No Child Left BehindでProficiencyレベルに達する割合を100%、つまり全生徒がProficiencyレベルに達することが明記されているので、そのプレッシャーがある。

2.それ故、Proficiencyレベルに多くの生徒が達することができるようにするため、Proficiencyレベルの下げ、割合が高くして、恰も生徒の学力が向上しているかのような情報を流している


と批判はされています・・・・・・・・・・が、このレポートの比較、肝心なことが抜けています。ズバリ、

NEAPのテストと各州政府のテストは、同じ難易度ではない

同じ難易度ではないため、仮にNEAPのテストの方が難しく、州規模のテストの方が簡単な場合、州規模のテストでのProficiencyレベルに達する割合が多くなるのは当たり前

さらに、NEAPのテストと州規模のテストはテストデザインが異なるため、この2つのテスト結果のスコアーはNot Comparable(比較できない)

NEAPはあくまでサンプルテストであり、州の一定の割合の生徒しか受けていないが、州規模は州内の全生徒が参加しているため、割合が異なるのは当たり前


と、これらの条件付きでの結果です・・・・・・・・が、このようなことは一切触れられずに割合が違うことばかりが強調された偏ったレポート結果です

確かに、(既に触れたように)States set the bar low on their tests(州内のテストのProficiencyレベルの基準値を低く設定している)というのは分かりますが、これはテストの難易度が低いという前提で成り立つ話です。

はっきり言って、テストの難易度でProficiencyレベルの割合などいくらでも変わります。NEAPのテストの難易度が正しい前提で、このNEAPの割合と比較していますが、実はこのアメリカ教育省が実施しているNEAP、州政府はテストデザイン、結果の信頼度等がおかしいと、州政府はNEAPにいまだ反対の立場です。

****
上記の情報、PARCCテストのスタッフと働いていた時、元マサチューセッツ州教育省トップだった私の(当時の)ボスからも聞いていたので、確認済みの情報です。
****

<総論>

このレポートにおける、単純比較し、誤った結果を示したレポート。こんな誤ったレポート、州政府や私が働くような学区で報告したら、Misrepresent、Misleadingしている!!と批判されるような内容です。

先に示したような注釈付きでの結果を報告しているなら話は分かりますが、レポートにそのような注釈は一切なく、完全なるMisleading(誤報)です。

テスト結果の比較は分り易くて結論に手っ取り早くいける反面、結果には細心の注意が必要・・・とこの報告を見てしみじみ実感しました。