先週末に大学入学共通テスト(旧センター試験)が行われました。
その問題を、AIに解かせたんですって。
何点くらいとれたと思います?

15科目を受けさせて、ChatGPTは97%の得点率だったそうです。
GeminiとClaudeはともに91%でした。

実際の受験生の平均得点率は約6割です。
東大を受けるなら8割5分から9割は取っておきたいななんて、昔から言われていましたけど、いまでもだいたいそんなもんなんですかね?
そのくらいはクリアできていることになります。

AIスタートアップのライフプロンプトと日本経済新聞が共同で調査した結果で、日本経済新聞にその結果がくわしく載っていました。
https://www.nikkei.com/article/DGXZQOUC190LP0Z10C26A1000000/?n_cid=NMAIL006_20260120_A

もっと簡易な共同通信の記事はこちら。
https://news.yahoo.co.jp/articles/ad54fc0d4d971f38e3beda002a8c8b95c99aaae1

ChatGPTは、2024年に66%、2025年に91%の得点率でした。
この数年で得点力をぐいっと上げてきています。
GeminiやClaudeもそれよりは得点がやや低いものの、問題文の入力から回答の出力まで1科目、最短でたったの4分で解き終えたそうです。

面白いのは、AIにも得意科目と不得意科目があることです。
何が得意で何が不得意かわかりますか?

ChatGPTは、数学のⅠAとⅡBC、化学、化学基礎、物理基礎、地学基礎、生物基礎、情報Ⅰ、公共・政治経済の9科目で満点でした。
GeminiとClaudeを含めても、やっぱり理系科目が得意なようです。
一方で取りこぼしが目立ったのは国語と地理でした。
地理の地図が出てくる問題は苦手っぽいです。
物理でも不規則な図が出てくると得点率が下がるようです。

中学受験の図形問題も、AIはまだ苦手にしているという本をつい先日読みました。
補助線を引かないと解けないような問題はまだ苦手なんだそうです。

この結果から、AIの癖みたいなものも見えてきたって記述があって興味深いです。
ChatGPTは時間はかかるけど、高得点。
Geminiは理系は得意だけど国語が苦手。
Claudeは比較的国語が得意。

私も昨年の夏からAIを利用するようになったんですけど、その感覚と合っている気がします。
いちばん自然な日本語を返してくれるのは、私の感覚ではClaudeです。
行間のメッセージまでを計算されたプロが書く商用の文章はとても無理ですけれど、報告書のような文章なら十分使えると思います。

ChatGPTは日本語としてはなめらかなんですが、たぶんごちゃごちゃ考えすぎて、結局何も言っていないような無難な文章になる傾向があるように思います。
その点Geminiは、要点をパパッとまとめるのが上手な印象です。
数年後にはこんな比較も意味をなさない状態になっていると思いますが。

だたし、AIがここまで発展したからといって勉強する意味がないって話にはまったくなりませんよね。
ものごとの原理原則は理解しておく必要があります。
それに、数学に美しさを感じたり、化学や物理の法則を知ることで目には見えない世界でどんなことが起きているのかを想像できるようになったりしますから。

だけど、原理原則さえわかっていれば、速く正確に正解にたどりつくことを比べられて競わされることにはあんまり意味がないともいえる状況になってきたんじゃないかと思います。
まったく手計算ができないのは困るけど、計算機があれば、素早くて計算ができたり暗算ができたりする必要があんまりないのと似たような状況にまでは来ている気がします。
 

 

※2026年1月22日のFMラジオJFN系列「OH! HAPPY MORNING」でお話しした内容です。