足下、我が国の児童福祉政策において大変重要な「こども基本法」に関する議論が国会でもおおいに進んでいます。

 私がやるべきことはこれから佳境ですが、EBPM()の観点から、これらの諸問題で子どもと教育データの利活用についての雑感を書けというので書くわけですが、まあなんというか悩みは深いわけです。

 一番気にしているのは、プッシュ型の行政で手厚く児童福祉をやり、自分からなかなか声を上げることのできない、例えば経済的に困窮した家庭の子どもや、親などからの虐待を受けている疑いのある子どもに対して行政が素早く対応するために、教育データを活用しようという話になるわけですが。

 必要なことだからやろう、公益だから踏み込もうという議論はもちろん賛同する一方で、学校で得られる教育データというものは、あくまで憲法で認められた子どもの権利である学習権を、よりよい形で実現するために学校が子どもとの信頼関係をもって取得する暗黙知でした。それは、明文化こそされないけれど、教師が子どもから信頼され、子どもを観察する中で得られた情報であったと。

 ところが、昨今の教育データにおいては、これらの子どもの情報そのものが利活用できるようになるぞということで、いままで学校の中で閉じた暗黙知として存在していたこれらのデータが、データベースに格納され、民間の教育ベンダーや自治体の子ども見守りデータベースに格納されることで第三者の目に触れるようになります。

 統計学と情報法をある程度学んできたわたし的に、私がはっきり言えるのは「悪用できちゃうよね」ということです。

 例えば、大阪府箕面市の子ども見守りデータベースでは、なぜか条例で認めた「世帯の情報」、例えば親の所得とか、家族構成、さらには生活保護受給の有無から給食費未払いなどのセンシティブなデータと併せて、子どもの学校での様子、例えば出席の状況や学習態度、宿題の提出状況、衣服の乱れなどのデータが同じダッシュボードで展開されます。ということは、これらのデータは多変量解析を行う目的で、同じデータベースに入っていることになります。

 そこから分かることは、学校で見過ごされてきた、問題を抱えた子どもの炙り出しだと説明をされます。総務省でも、デジタル庁でも、かなり牧歌的に「なるほど、そういうデータが出てくるのか」と信じています。

 しかしながら、これをやった場合に(特に多変量解析において)分かることは、例えば以下のような事柄です。

・親の所得が高いほうが成績や生活態度が良い
・兄弟がいる家庭よりも、一人っ子のほうが成績や生活態度が良い
・共働きの家庭よりも、専業主婦のほうが子どもの成績や生活態度が良い
・核家族よりも祖父・祖母が同居しているか、近隣に住んでいる家庭のほうが子どもの成績や成績態度が良い

 そして、これらを長期的に経過観察してコホートやるんだよとなれば、子どもの生活と学習の観点から評点を下すならば、他国での教育経済学的知見と同様に、親の所得が高いほうが、兄弟はいないほうが、一族が固まって住んでいるほうが、専業主婦のほうが、成績が上がり、生活態度が良いということがエビデンスとして簡単に出てくるようになるでしょう。

 問題は、これらの教育データを利活用することでワンストップで児童福祉の現場に情報が提供できるようになるということは、逆説的に、低所得で、低学歴な親に養われている、片親の子どもが自動的にピックアップされることになります。もちろん、高学歴な親が家庭内の性格的に粗暴で日々子どもに暴力を振るう家庭が出てくることもあるかとは思いますが、これらのデータを集めてきたうえで、当初、デジタル庁などが言っているように長期的な子どもに関するデータとして蓄積するのであれば、いわば「問題を抱える家庭環境の子ども」を炙り出すはずが、教育データの推移から「学習面で見込みのない子ども」がはっきりしてしまいます。

 正直言えば、これは絶対に分かります。また、長期的影響を把握すると言って、個別最適化された学びのような中教審の方針をもとに教育データの利活用を行うことになってしまえば、家庭の状況と子どもの生活態度とから導き出された分析によって、将来的に学歴で劣後するであろう子どもや、収入が低い子どもが、おそらく小学校高学年で分かるようになってしまいます。

 一億歩譲って、公教育の現場と地方公共団体とが責任もってこれらの子どもに関する情報を保持しているからそのような分析はなされないのだと主張するとして、では、すでに民間のサービスとして公教育の現場に入っているGoogle for Schoolなどのプラットフォーム事業者の仕組みや、リクルートやQubena(COMPASS社)、あたまプラス、ベネッセなど教育ベンダーが提供しているアプリ・サービス経由で公教育での子どもに関する教育データが吸い上げられ、分析される恐れはあります。

 そして、国会答弁でも統計的に解析するために匿名処理されたデータを活用する方針が出ているようですが、実装する内容はおそらく異なります。デジタル庁の教育データ利活用ロードマップにおいては、これらの情報は識別子(ID)が振られてデータベース管理されていることになり、そもそもこの時点で匿名加工処理ではなく仮名加工処理です。また、長期的影響を踏まえた個別最適化された学びを実現するのであれば、これらのデータは仮名加工ですらなく、実名で行われる必要があります。

 さすがに情報法の観点からも統計的分析の手法からもいまの教育データにまつわる議論は本当にメタメタになりかねないのですが、例えば、公知として「兄弟のいる子どもは成績面で必ず不利になる」ことが明らかになった場合、大学入試改革で「兄弟のいる子どもは学習面でハンディキャップを抱えているので公平な入試にするためテスト得点に下駄を履かせることの是非」まで議論しなければならなくなります。

 いまでこそ、ジェンダーギャップだ何だと言われていますが、男女の性別差で有利不利があるという議論ですったもんだしているのに、教育データの長期的分析が炙り出す「この地域に住む人たちは所得が低いので、そこに通う子たちは成長して社会人になっても大半は地元にとどまり、低い給料の就業で我慢する人生を送ることになる」という不都合な真実にどれだけ向き合うことができるのか、という話にもなります。

 そこには、おそらくは広域通信制高校であるトライ高等学院やN高校のような教育の質が高いとは言えない高等教育への評価や現状是正をどうするかだけでなく、子どもの総数が減っていく中で我が国の教育全体をどうデザインし、学びたい人たちが如何に望ましい環境で学ぶことができ、親の所得や生まれた地域といった本人の責任に帰さない属性で蒙る不利を見つけ出し、救済するのかといった、より長期的な視座が必要になります。

 よく、教育データの利活用で「アメリカなどでの先進的な事例は」とか「イギリスのパブリックスクールでは」という話が国際比較で出ます。いまさらのように、他国の教育データ利用の事例について公金を使って調査するので手伝えというような話さえも来ます。ただ、諸国の事例は日本とは常に異なります。日本では、デジタル大臣の牧島かれんさんまで出てきて「教育データは国家が一元管理しない」と言っている横で、イギリスの先進事例をうらやむ教育者は、そもそもイギリスでは教育庁が国家プロジェクトとしてすべての子どもの教育データを管理することを忘れています。また、フロリダ州やテキサス州で子どもデータベースの充実を州政府自らが行った理由は、州議会での議論を見ればわかる通り、アメリカの子どもたちは小学校からすでに、妊娠、拳銃、ドラッグの三大問題に常に晒されており、日本とは比べ物にならない割合で発生する虐待や性犯罪とこどもが隣り合わせだから教育データを完備して子どもを社会が守らなければならないという要請があります。

 そもそも13歳以下の子どものデータに対して取得制限のあるアメリカと、基本的な保護の枠組みしか定めておらず子どものデータを取り分析することがなぜか自由な日本とで情報法制や教育データの枠組みを単純比較するほうが愚かと言えます。この問題を忘れて、教育データとはなんぞやという話をいくら国会で積み重ね、こども家庭庁の意義のある児童福祉とどう連関させるのかを語ったところでたいした役には立たないかもしれません。

 子どもの教育データを利活用することには賛成です。学校をICT化し、時代に即した公教育を行うことも賛成です。子どもの情報を集約し、きめ細かい児童福祉を実現することで子どもの健全育成に国家や行政が責任を持とうとすることにも賛成です。

 ただし、それらはきちんとした法整備を行い、不適切な形で個人情報が流用され、悪用されないようにすることが大前提です。その問題を飛ばして議論をすると、なかなか面倒なことになるのだろうなあと思いながら半笑いで会議に臨席しています。