讯飞星火 X1 全新升级,整体效果对标 OpenAI o1 和 DeepSeek R1
GoodNav 4 月 21 日报道,科大讯飞今天正式宣布,讯飞星火 X1 进行了全新升级,成为“当前行业内唯一基于全国产算力训练的深度推理大模型”。
此次升级包含以下关键信息:
-
在数学、代码、逻辑推理、文本生成、语言理解、知识问答等通用任务上,效果显著提升,尽管模型参数比行业同类模型小一个数量级,整体效果与 OpenAI o1 和 DeepSeek R1 相当。
-
融入了更多复杂场景的数据,模型的泛化能力也得到了提升,在多个行业任务中展现出行业领先的能力,尤其在教育、医疗、司法等重点行业进一步巩固了领先优势。
-
首次推出快思考与慢思考统一模型,支持两种思考模式,私有化部署变得更加简便;全新升级的模型定制优化工具链,支持 SFT 和强化学习两种模型定制优化方案,定制门槛较低。
-
三大核心技术创新——大规模多阶段强化学习训练方法、基于快慢思考的统一训练方法、工程技术系统创新,确保基于国产算力的长期稳定训练,助力星火 X1 全面升级。
此次星火 X1 升级在多个任务上实现了突破。根据最新的测试集评测结果,星火 X1 在通用任务效果评测中全面对标 OpenAI o1 和 DeepSeek R1,在数学、知识问答等方面表现尤为突出。以下是对比成绩:
星火 X1 除了在常见通用任务上取得显著进步外,由于融入了更多复杂场景的数据,模型的泛化能力也得到了提升,在多个行业任务中展现出行业领先的能力,尤其在教育、医疗、司法等重点行业进一步扩大了领先优势。
为了让更多企业能够方便地使用 AI,本次升级的星火 X1 为企业 AI 的落地提供了双重支持:
-
首次推出快思考与慢思考统一模型,支持两种思考模式,4 张卡(华为 910B)即可部署完整版本的星火 X1,私有化部署变得简单。
-
全新升级的模型定制优化工具链,支持 SFT 和强化学习两种模型定制优化方案,16 张卡(华为 910B)即可完成行业定制优化,定制门槛较低。
讯飞星火网页端或讯飞星火 App 已上线全新升级的讯飞星火 X1,用户可以体验在通用任务上深度推理和联网搜索的全新效果。
同时,星火 X1 API 也已同步上线讯飞开放平台,面向开发者和企业开放服务。