苹果 AI 研究：“猕猴桃”简单算术考倒 o1 和 Llama 等 20 多个最先进模型

1.3K 0 0

GoodNav 于11月2日报道，《洛杉矶时报》在11月1日发布了一篇博文，提到苹果的研究团队对20个领先的AI模型进行测试，结果显示在存在干扰项的情况下，这些模型在处理简单的算术问题时的表现不及小学生。

苹果公司用一道简单的算术题来测试这些先进的AI模型，题目如下：

Oliver在星期五拾取了44个猕猴桃，随后在星期六又拾取了58个，星期日的数量是星期五的两倍，但其中有5个猕猴桃的大小低于平均水平，请问Oliver这三天共拾取了多少个猕猴桃？

正确答案是190个，计算方式为44（星期五）+58（星期六）+88（44乘以2，星期日）。

然而，测试的20多个先进AI模型未能排除干扰因素，通常错误地认为猕猴桃的大小与数量相关，最终大多数结果为185个。

苹果 AI 研究：“猕猴桃”简单算术考倒 o1 和 Llama 等 20 多个最先进模型

苹果团队发现，当问题中包含看似相关但实际上无关的信息时，AI模型的表现会显著下降。研究指出，AI模型主要依赖于训练数据中的语言模式，而不是对数学概念的真正理解。

苹果的研究表明，当今的AI模型“无法进行真正的逻辑推理”。这一发现提醒我们，尽管AI在某些任务上表现出色，但其智能并不如表面所示那样可靠。

苹果 AI 研究：“猕猴桃”简单算术考倒 o1 和 Llama 等 20 多个最先进模型

苹果团队指出，简单增加数据量或计算能力并不能根本解决这一问题，苹果的论文旨在激发对AI能力的理性认知，而非削弱对其的热情。

文章版权归作者所有，未经允许请勿转载。

GoodNav.net

1.1K

GoodNav.net

500

GoodNav.net

350

GoodNav.net

1.2K

GoodNav.net

1.2K

GoodNav.net

2.5K

暂无评论

您必须登录才能参与评论！

立即登录

暂无评论...