苹果 AI 研究:“猕猴桃”简单算术考倒 o1 和 Llama 等 20 多个最先进模型
GoodNav 于11月2日报道,《洛杉矶时报》在11月1日发布了一篇博文,提到苹果的研究团队对20个领先的AI模型进行测试,结果显示在存在干扰项的情况下,这些模型在处理简单的算术问题时的表现不及小学生。
苹果公司用一道简单的算术题来测试这些先进的AI模型,题目如下:
Oliver在星期五拾取了44个猕猴桃,随后在星期六又拾取了58个,星期日的数量是星期五的两倍,但其中有5个猕猴桃的大小低于平均水平,请问Oliver这三天共拾取了多少个猕猴桃?
正确答案是190个,计算方式为44(星期五)+58(星期六)+88(44乘以2,星期日)。
然而,测试的20多个先进AI模型未能排除干扰因素,通常错误地认为猕猴桃的大小与数量相关,最终大多数结果为185个。
苹果团队发现,当问题中包含看似相关但实际上无关的信息时,AI模型的表现会显著下降。研究指出,AI模型主要依赖于训练数据中的语言模式,而不是对数学概念的真正理解。
苹果的研究表明,当今的AI模型“无法进行真正的逻辑推理”。这一发现提醒我们,尽管AI在某些任务上表现出色,但其智能并不如表面所示那样可靠。
苹果团队指出,简单增加数据量或计算能力并不能根本解决这一问题,苹果的论文旨在激发对AI能力的理性认知,而非削弱对其的热情。
© 版权声明
文章版权归作者所有,未经允许请勿转载。
相关文章
暂无评论...