Loading...

豆包大模型发布各领域技术进展,首次披露 300 万长文本能力

GoodNav于12月30日报道,字节跳动旗下的豆包大模型今日公开了2024年各领域的技术进展,声称自5月15日推出以来的七个月里,其在通用语言、视频生成、语音对话、视觉理解等方面的模型能力已进入国际领先行列。

据介绍,到2024年12月,最新的豆包通用模型 Doubao-pro-1215 的综合能力较5月提升了32%,已全面对齐GPT-4o,在数学和专业知识等复杂场景任务中,表现甚至更优秀,同时其推理服务的价格仅为GPT-4o的八分之一。通过海量数据的优化与模型架构的创新,如提升模型稀疏度及引入强化学习,该模型的理解精度和生成质量都有了显著提高。

豆包还首次公布了其大模型300万字窗口的长文本处理能力。根据介绍,该模型能够一次性轻松阅读“上百篇”学术报告,每百万tokens的处理延迟仅为15秒。其背后借助了STRING等上下文关联数据算法,极大地增强了LLM对海量外部知识的利用能力,稀疏化及分布式方案将时延降至十秒级。

豆包大模型发布各领域技术进展,首次披露 300 万长文本能力

© 版权声明

相关文章

暂无评论

您必须登录才能参与评论!
立即登录
暂无评论...