豆包大模型发布各领域技术进展，首次披露 300 万长文本能力

970 0 0

GoodNav于12月30日报道，字节跳动旗下的豆包大模型今日公开了2024年各领域的技术进展，声称自5月15日推出以来的七个月里，其在通用语言、视频生成、语音对话、视觉理解等方面的模型能力已进入国际领先行列。

据介绍，到2024年12月，最新的豆包通用模型 Doubao-pro-1215 的综合能力较5月提升了32%，已全面对齐GPT-4o，在数学和专业知识等复杂场景任务中，表现甚至更优秀，同时其推理服务的价格仅为GPT-4o的八分之一。通过海量数据的优化与模型架构的创新，如提升模型稀疏度及引入强化学习，该模型的理解精度和生成质量都有了显著提高。

豆包还首次公布了其大模型300万字窗口的长文本处理能力。根据介绍，该模型能够一次性轻松阅读“上百篇”学术报告，每百万tokens的处理延迟仅为15秒。其背后借助了STRING等上下文关联数据算法，极大地增强了LLM对海量外部知识的利用能力，稀疏化及分布式方案将时延降至十秒级。