标签:o1

o1 规划能力首测:已超越语言模型范畴,preview 终于赢 mini 一回

o1-preview 终于在一次较量中超越了 mini!亚利桑那州立大学的最新研究显示,o1-preview 在规划任务方面的表现明显优于 o1-mini。 与传统模型相比,其优势更...

OpenAI o1 AI 模型 PlanBench 规划能力实测:准确率 97.8%,远超 LLaMA 3.1 405B 创造的 62.6% 纪录

9 月 25 日消息,来自亚利桑那州立大学的科研团队利用 PlanBench 基准,测试了 OpenAI o1 模型的规划能力。研究结果表明 o1 模型取得了长足的进步,但仍然存...

o1 核心作者 MIT 演讲:激励 AI 自我学习,比试图教会 AI 每一项任务更重要

“o1 发布后,新的范式应运而生”。在这方面,OpenAI 的研究科学家、o1 的核心贡献者 Hyung Won Chung 最近在 MIT 的一次演讲中分享了他的见解。演讲的主题是“D...