
生成人工知能(AI)が日本の最高学府である東京大学の今年の入試問題を解いた結果、合格者最高点を上回る成績を記録したことがわかった。
AIベンチャー企業の「株式会社LifePrompt」は、OpenAIの「GPT-5.2 Thinking」、Googleの「Gemini 3 Pro プレビュー」、Anthropicの「Claude Opus 4.5」など3つのAIモデルが2026年度の東京大学と京都大学の入試問題を解答した結果を27日に公開した。
LifePromptによると、試験問題はPDFを画像化してAIに入力し、ウェブ検索は使用せずAIの学習知識と推論能力だけで解答させた。記述式の答案は大手入試予備校河合塾の講師が実際の受験生と同じ基準で採点した。
その結果、ChatGPTは今年の東京大学入試で理系、特に医学部進学者が多い理系三類では550点満点中503.59点を記録した。これは東京大学が発表した今年の理系三類合格者の最高点453.60点より約50点高い点数だ。文系でもChatGPTは452点を取得し、文系の最高点である文系三類の434点を上回った。
ChatGPTは京都大学法学部入試問題では885点満点中771点、医学部医学科入試問題では1275点満点中1176.25点を記録した。ただし、LifePromptは京都大学の今年の合格者最高点がまだ公開されていないため、昨年度のデータと比較したと述べ、医学部基準では昨年の最高点1105.87点を70点以上上回ったことになると説明した。
Geminiは東京大学理系三類で496.54点を記録し、やはり合格者の最高点より高い点数を記録した。Claudeは今年の入試最高点には達しなかったが、全科目で合格最低点を100点以上上回った。
科目別では特に数学の好成績が顕著だった。ChatGPTは東京大学理系数学(120点満点)と文系数学(80点満点)、京都大学理系数学(200点満点)と文系数学(150点満点)で全て満点を記録した。ChatGPTは京都大学の化学でも満点を記録し、Geminiは東京大学理系・文系数学と京都大学理系数学で満点を記録した。
一方、弱点も明らかになった。LifePromptと河合塾の講師たちの分析によると、AIは英語と数学、理系科目では高い安定性を示したが、世界史・日本史などの論述型問題では情報の取捨選択、文章構成、出題意図の把握に限界を示した。
LifePromptは2024年から毎年AIに東京大学入試問題を解かせている。2024年当時「ChatGPT-4」は全科目不合格、昨年は「o1」モデルが初めて合格ラインを突破した。
LifePromptの遠藤聡志代表は、「今回の検証でAIが満点を取れる課題とそうでない課題が明確に分かれることが明らかになった」とし、「入試でAIの『賢さ』は十分に証明された。これからは各企業がAIをどう活用するかの戦いだ」と述べた。













コメント0