OpenAI o3 AI 模型突破推理极限背后:成本飙升,没“钞能力”用不起
GoodNav 12 月 24 日报道,科技媒体 TechCrunch 于昨日(12 月 23 日)发布的一篇博文指出,虽然 OpenAI 的 o3 模型在 ARC-AGI 等测试中表现出色,但其背后的高昂计算成本使得短期内难以在实际应用中得到广泛推广。
o3 性能
o3 的一项新功能是能够调整推理时间,计算级别分为低、中和高三种,计算级别越高,o3 的任务执行效果越佳。
作为 OpenAI 迈向这一目标的重要一步,o3 在 ARC-AGI 基准测试中,高计算设置下得到了 87.5% 的分数,而在低计算设置下得分为 75.7%,性能是 o1 的三倍。
在 EpochAI 的 Frontier Math 基准测试中,o3 解决了 25.2% 的问题(其他模型的解决率都未超过 2%),创造了新的纪录。
o3 模型成本高昂
ARC-AGI 基准测试的创始人 François Chollet 在博文中提到,尽管 OpenAI 的 o3 模型在 AI 领域实现了重要突破,但其成本实在过于高昂。
根据 ARC-AGI 测试的性能图,o3 的高分版本在每项任务中使用的计算资源价值超过了 1000 美元(目前约合 7303 元人民币),而 o1 模型每个任务的资源使用约为 5 美元,o1-mini 则仅需几美分。
这表明,尽管 OpenAI 达到了近 88% 的高分,但却消耗了超过 170 倍的计算资源,使用高计算版本的 o3 整个测试成本超过 1 万美元(目前约合 73033 元人民币),因此只有财力充裕的机构和个人才能承受 o3 模型的使用费用。
o3 模型的高计算成本使其更适合处理复杂问题,如长期战略决策,而不适合解决日常小问题;更高效的 AI 推理芯片和更具成本效益的 AI 芯片可能是未来降低 o3 模型使用成本的关键所在。
© 版权声明
文章版权归作者所有,未经允许请勿转载。
相关文章
暂无评论...