科大讯飞星火 X1 模型升级,数学能力全面对标 DeepSeek R1 和 OpenAI o1
GoodNav在3月3日报道,科大讯飞今日宣布对星火X1进行升级,并推出星火一体机等全新产品。
在此次升级中,深度推理大模型星火X1重新进行优化,其数学能力已全面接轨DeepSeek R1和OpenAI o1。
科大讯飞指出,此次升级显著提升了数学问题的回答表现,特别是在面对竞赛级难题时的优异表现。此外,星火X1在中小学数学作业的批改、辅导及题目推荐等方面也展示出了显著的优势。
升级后的星火X1也提升了讯飞晓医、星火教师助手、AI法官助理等应用与产品,具体官方介绍如下:
讯飞晓医首次推出星火医疗大模型X1
此次升级中,讯飞医疗首次推出星火医疗大模型X1,声称“大幅降低了医疗幻觉问题”,在处理复杂问题时,能够逐步解释证据过程,提高医疗推理在复杂场景中的逻辑性、专业性和可解释性。在诊断建议、健康咨询、检查报告解读等推理任务上,其表现已显著超越GPT-4o和DeepSeek R1。
现在,星火医疗大模型X1已正式应用于AI健康助手“讯飞晓医”,与用户个人健康档案的结合更为紧密,使其能深入了解用户的健康状况,思考潜在需求,从而解决过去AI医疗咨询中的“建议宽泛不实用”的痛点,提供更个性化、具体的医疗建议。
例如,当用户咨询疾病用药时,晓医能够依循证据指出该疾病的正确用药原则,并结合用户的既往健康情况,给出更加合适和详细的处理建议及注意事项。
星火教师助手
在讯飞星火X1的全面升级基础上,面向备授课的星火教师助手也进行了进一步优化,提供了更清晰、详实的AI教学思路。
-
在备课阶段,与之前直接生成教学设计的线性流程相比,现有的星火教师助手能够结合教师的意图,明确教学的重难点及达成目标,并在生成教学设计时逐步解释,帮助老师理解生成内容的逻辑性,并激发创新灵感。
-
在授课过程中,通过思维链显性化的呈现,师生可以实时观察认知思维构建的过程,使课堂互动更直观,促进探究式的课堂开展。
这些功能已在数学、语文、历史等多个学科中得到了应用。
经过升级的星火教师助手,实现了教育教学AI工具的“思维可视化”,能够追踪从学生对基础问题的提问到复杂问题的深入探究的全过程,更加有利于教学创新和学生高阶思维能力的培养。
AI法官助理
在本次升级中,科大讯飞将星火长思维链深度推理技术与法律法规、司法解释等专业知识紧密结合,宣称不仅解决了传统大模型中的知识幻觉问题,还提升了在复杂场景中所需的法律推理能力,包括证据审查、量刑辅助及裁判观点总结等方面。
例如,在裁判观点总结场景中,借助卷宗材料总结案件事实,根据事实与匹配的法律法规及案例进行逐条分析与对比,并将整个过程可视化,输出附有法理依据的裁判观点,提供决策支持。
目前,星火大模型的能力已经涵盖案件分析、证据审查、庭审提纲辅助生成、裁判辅助等多个环节。