Loading...

中美 AI 挑战东京大学入学考试:双双合格,英语优异,数学欠佳

GoodNav 4 月 7 日报道,根据日经新闻 4 月 5 日的消息,日本经济新闻与多家民间企业及大型补习班的联合研究发现,中美两国的新型生成式 AI 已具备通过日本最为严苛的东京大学理科 3 类入学考试的能力。这两个模型在语言能力的英语测试中表现出色,但在数学方面却频繁出现论证错误等问题。

此次测试让美国 OpenAI 的“o1”和中国 AI 初创公司 DeepSeek 的“R1”两个基础模型解答 2025 年的东大入学考试题目。AI 初创公司 Life Prompt(东京・新宿)提供了答案,并由大型预备学校河合塾的讲师进行评分。

中美 AI 挑战东京大学入学考试:双双合格,英语优异,数学欠佳

在大学入学共通考试和二次考试的理科总分中(注:满分为 550 分),o1 和 R1 分别获得 374 分和 369 分,均超过了东大在 3 月 10 日公布的理科 3 类合格最低分数线(368.7 分)。

虽然 R1 在理科 1 类和理科 2 类的共通考试中未能达到合格最低分数线,但在其他科目中,连同文科在内与 o1 一起均“合格”了。

在二次考试中,英语的得分率较高,o1 与 R1 的得分率均超过 75%。负责英语的河合塾讲师久恒秀雄表示:“几乎没有单词和语法错误,远远超过了东大考生的平均水平。”

数学方面,尽管最终答案正确的问题不少,但在图形和论证类问题上频繁出现论述错误和解释不足的现象。在理科数学中,o1 在 120 分满分中得了 38 分,R1 的得分为 49 分。负责数学的香坂季京讲师指出:“这分数比合格者的平均分要低很多。”

自 2011 年启动的“机器人能否进入东京大学(东 Robo)”项目的负责人、国立信息学研究所的新井纪子教授对此次考试结果表示:“这是 AI 发展的一个重要里程碑。然而,AI 有时会提供相当糟糕的答案,因此需要能够正确判断并熟练运用 AI 输出的人才。”

© 版权声明

相关文章

暂无评论

您必须登录才能参与评论!
立即登录
暂无评论...