鸿海首个大语言模型 FoxBrain 发布:具备推理能力,未来计划部分开源
GoodNav 3 月 10 日报道,鸿海今日宣布推出其首个大型语言模型“FoxBrain”,并计划利用这一技术来优化制造和供应链管理。
在声明中,鸿海表示,FoxBrain 是由 120 块英伟达 H100 GPU 训练而成,训练过程持续了约四周。鸿海目前不仅是苹果 iPhone 的组装商,也是英伟达 AI 服务器的制造商,同时是全球最大的电子产品代工企业。
该模型基于 Meta 的 Llama 3.1 架构,并经过专门优化以适应繁体中文及本土语言风格。鸿海声称,这是当地首个具有推理能力的大型语言模型。虽然 FoxBrain 在性能上略逊于 DeepSeek 的蒸馏模型,但整体表现已接近全球顶尖水平。
FoxBrain 主要用于内部场景,支持数据分析、决策支持、文档协作、数学计算、推理与问题解决以及代码生成。
鸿海计划与科技公司合作,拓宽该模型的应用领域,并开放部分源代码,以推动人工智能在制造、供应链管理和智能决策领域的发展。
英伟达也向 FoxBrain 的训练提供了支持,通过其位于高雄的超级计算机“Taipei-1”提供计算能力,并在训练过程中提供技术指导。
注:“Taipei-1”是当地最大规模的超级计算机,由英伟达在高雄运营。
© 版权声明
文章版权归作者所有,未经允许请勿转载。
相关文章
暂无评论...