騒ぎになっているというので見物に行きました。

https://twitter.com/noricoco/status/1111065833055240193

[引用]
東ロボの成果はAAAI,ACL等CORE A*の国際会議に採択されており、RSTは認知心理のトップカンファレンスであるCogSciに複数回採択されています。「AI vs. 教科書が読めない子どもたち」はそれに基づいて書かれており、情報系書籍に対する最も権威のある大川出版賞を受賞しています。

--

 おそらく新井紀子せんせに批判を重ねているのはピュアに人工知能を研究している人たちで、2016年に限界が見えてクローズしてしまったのにいまなお一線の研究成果があるかのように見せている東ロボくんやRST(リーディングスキルテスト)の実態に対して「それは新井せんせが山月記酷評しつつ論じるべきことじゃないだろうよ」という風に思われているのではないか、と妄想します。新井せんせももう少し分かりやすい表現をされていればなお理解者が増えたんじゃないかと思うので、そこは残念です。

 それにしても、発達障害でも拗らせているのか精神衛生に問題があるのかこの界隈のことは分かりませんが、いまいまのベンチマークに役立つような東ロボくんの成果はすでに失われているか時代遅れになっている現状は重ねて指摘されているようで、どういう理由かRSTを全国の中学一年生に受けさせるというような一種独特な名誉欲の発露というのは興味深いところです。

 例えば、RSTが知能指数(FIQ)に0.85の相関があるので役に立つとの話ですが、普通にSAPIXや早稲田アカデミー(四谷大塚)の公開模試の結果のほうが相関がわずかに高いわけですし、そもそも一発文章を読んですべてを読解できる能力が万人に備わっているわけではないことなど古来から知られていることで、別にリーディングスキルが高いか低いかはいまに始まったことでもなさそうです。

 英語やプログラミング教育よりも、日本語が読めない状況をどうにかするべきという新井せんせのご主張は総論で賛成するものの、一方でRSTがメジャメントとして適切かどうかは議論が分かれるところですし、新井せんせがRSTを広げたところで読解力を引き上げる方法が開発されない限りは「ああ、みんな今年もダメなんすね。以上!」というだけの話になり、現在猛烈な利権になっている小学校六年生と中学三年生の全国学力テストにコーホートで参照可能なRSTのエッセンスだけぶち込んでおけばそれでいいんじゃないかと思ったりもします。

 つまりは、人工知能に関する研究としても2016年(実質的に15年ごろ?)で終わっていてすでに他社・他プロジェクトのベンチマークのほうがいろいろ達成できる状況になって東ロボくんの学術的価値はすでに抜き去られた状態になっています。なぜか社会運動化してしまったRSTもそのテストの結果をもって「日本人は日本語が読めていない」と結論付けることはむつかしく、仮に普及させたところで新井紀子せんせにはそういう読解力を引き上げるメソッドを開発する能力は恐らくお持ちではないでしょうから教育界からもさすがに新井せんせの言っていることは分からないという反応が出てきても何も不思議ではないのかなあと感じます。

 新井せんせの仰る人工知能の面でも教育・認知学の面でもいったん終わった話で、いまさらどこの学会で何を出したとか、どこで賞を取ったとかは、あんまり関係ないんじゃないかと思うんですよ。SQuADやSWAGいじりながらあれこれ模索することはあっても、東ロボくんで何かを為そうという人は(たぶん)2019年のいまは日本人でもほとんどいないだろう、とはいえ「新井せんせが数学者などから相手にされてない」とまで言うのは言い過ぎだろうとも感じるわけですが、新井せんせが野良垢に煽られて荒ぶってるのを見ると「ちゃんと有識者が集まって、東ロボくんの総括と葬儀をやったほうがいいんじゃないか」と結構深刻に思います。神の元に召されていないので、亡霊のように憑いてしまっているんじゃないのかなあ、と。

(補遺)

 蛇足ながら、RSTに限らず、制限時間内で文章を読み読解された内容を解答するというのは、FIQの群指数に分けられ、新井せんせのお考えや学識、成果とは関係なくWAISでVIQとして測定されます。ただし、それが教育として望まれる読解力としての指標としていいのか、は研究者、教育者によって分かれます。

 短い文章でもそこから情感を掴み取り、感動する能力。

 長い文章を読みこなし、正確に物事を理解したり著述する能力。

 おのおの別の群指数である限りにおいて、詩的表現の読解よりもRSTが例示するような学力指標に使われる読解のほうが上だとは言い切れません。

 新井せんせが正しいのは、より統一的で、人間の知覚能力に標準的なメジャメントを用意しましょうということで、これはある程度真面目に取り組んだほうがいいと感じます。一方で、人間の読解力というのは試験で一発読みしてどれだけ短期記憶(WM)にぶち込んで理解度を引き上げられたか(VIQ)のみが指標ではないよなあという風にも思います。

 山月記のような粗い、でも情景を掴み取って脳内でイメージする力と、家電製品の取扱説明書を一度二度読んで正確に操作できる読解力とは、どっちが大事なんだろうなあと思い始めると振り出しに戻る。

ai_kenka.png