Loading...

科大讯飞星火 X1 模型升级,数学能力全面对标 DeepSeek R1 和 OpenAI o1

GoodNav在3月3日报道,科大讯飞今日宣布对星火X1进行升级,并推出星火一体机等全新产品。

在此次升级中,深度推理大模型星火X1重新进行优化,其数学能力已全面接轨DeepSeek R1和OpenAI o1

科大讯飞指出,此次升级显著提升了数学问题的回答表现,特别是在面对竞赛级难题时的优异表现。此外,星火X1在中小学数学作业的批改、辅导及题目推荐等方面也展示出了显著的优势。

测试集合来源:中文测试集来自2023/2024年各学段考试真题/模拟题/竞赛题,英文测试集来自AIME 2024/2025和MATH 500竞赛集

测试集合来源:中文测试集来自2023/2024年各学段考试真题/模拟题/竞赛题,英文测试集来自AIME 2024/2025和MATH 500竞赛集

升级后的星火X1也提升了讯飞晓医、星火教师助手、AI法官助理等应用与产品,具体官方介绍如下:

讯飞晓医首次推出星火医疗大模型X1

此次升级中,讯飞医疗首次推出星火医疗大模型X1,声称“大幅降低了医疗幻觉问题”,在处理复杂问题时,能够逐步解释证据过程,提高医疗推理在复杂场景中的逻辑性、专业性和可解释性。在诊断建议、健康咨询、检查报告解读等推理任务上,其表现已显著超越GPT-4o和DeepSeek R1

数据来源: 晓医、智医助理、安贞心内科等测试集

数据来源:晓医、智医助理、安贞心内科等测试集

现在,星火医疗大模型X1已正式应用于AI健康助手“讯飞晓医”,与用户个人健康档案的结合更为紧密,使其能深入了解用户的健康状况,思考潜在需求,从而解决过去AI医疗咨询中的“建议宽泛不实用”的痛点,提供更个性化、具体的医疗建议。

例如,当用户咨询疾病用药时,晓医能够依循证据指出该疾病的正确用药原则,并结合用户的既往健康情况,给出更加合适和详细的处理建议及注意事项。

星火教师助手

在讯飞星火X1的全面升级基础上,面向备授课的星火教师助手也进行了进一步优化,提供了更清晰、详实的AI教学思路。

科大讯飞星火 X1 模型升级,数学能力全面对标 DeepSeek R1 和 OpenAI o1

  • 在备课阶段,与之前直接生成教学设计的线性流程相比,现有的星火教师助手能够结合教师的意图,明确教学的重难点及达成目标,并在生成教学设计时逐步解释,帮助老师理解生成内容的逻辑性,并激发创新灵感。

  • 在授课过程中,通过思维链显性化的呈现,师生可以实时观察认知思维构建的过程,使课堂互动更直观,促进探究式的课堂开展。

这些功能已在数学、语文、历史等多个学科中得到了应用。

经过升级的星火教师助手,实现了教育教学AI工具的“思维可视化”,能够追踪从学生对基础问题的提问到复杂问题的深入探究的全过程,更加有利于教学创新和学生高阶思维能力的培养。

AI法官助理

在本次升级中,科大讯飞将星火长思维链深度推理技术与法律法规、司法解释等专业知识紧密结合,宣称不仅解决了传统大模型中的知识幻觉问题,还提升了在复杂场景中所需的法律推理能力,包括证据审查、量刑辅助及裁判观点总结等方面

科大讯飞星火 X1 模型升级,数学能力全面对标 DeepSeek R1 和 OpenAI o1

例如,在裁判观点总结场景中,借助卷宗材料总结案件事实,根据事实与匹配的法律法规及案例进行逐条分析与对比,并将整个过程可视化,输出附有法理依据的裁判观点,提供决策支持。

目前,星火大模型的能力已经涵盖案件分析、证据审查、庭审提纲辅助生成、裁判辅助等多个环节。

© 版权声明

相关文章

暂无评论

您必须登录才能参与评论!
立即登录
暂无评论...