百川智能发布全链路领域增强金融大模型 Baichuan4-Finance，测试成绩领先 GPT-4o

915 0 0

GoodNav 12 月 23 日报道，百川智能今日推出了全链路领域增强金融大模型 Baichuan4-Finance，该模型融合了超过 100B 的中英文金融知识，并通过多层次的质量评估体系进行筛选，整个过程由人民大学财政金融学院的金融专家团队参与定义和评估。

在中国人民大学财政金融学院新近发布的评测体系 FLAME 以及国内开源金融评测基准 FinancelQ 中，Baichuan4-Finance 均位居榜首，展现出金融专业能力和场景应用能力均优于 GPT-4o。

Baichuan4-Finance 的 API 现已在百川智能官网正式上线，测试成绩如下：

根据 FLAME-Cer 评测结果，Baichuan4-Finance 在银行、保险、基金、证券等多个认证领域的准确率均超过 95%，整体准确率为 93.62%，显著优于 GPT-4o 和 XuanYuan3-70B-Chat，超过 GPT-4o 近 20%。

在 FLAME-Sce 评测中，Baichuan4-Finance 一级核心金融业务场景的整体可用率达到 84.15%，金融数据计算和金融知识理论等场景的可用率均超过 90%。

在国内开源金融评测基准 FinanceIQ 中，Baichuan4-Finance 同样超越了 GPT-4o 和 XuanYuan3-70B，整体准确率达 79.23%，领先 GPT-4o 近 13%。

文章版权归作者所有，未经允许请勿转载。

GoodNav.net

630

GoodNav.net

1.2K

GoodNav.net

1.4K

GoodNav.net

1.5K

GoodNav.net

605

GoodNav.net

635

暂无评论

您必须登录才能参与评论！

立即登录

暂无评论...