Loading...

CMMLU

AI人工智能AI模型评测

CMMLU

一个综合性的大模型中文评估基准

标签：AI模型评测AI模型评测

链接直达手机查看

CMMLU是一项全面的中文评测基准，旨在评估语言模型在中文环境下的知识与推理能力，涵盖了从基础学科到高级专业的67个主题。该基准包括自然科学中的计算和推理、人文和社会科学中需要的知识，以及需要生活常识的中国驾驶规则等。此外，CMMLU中的许多任务具有中国特有的答案，这些答案在其他地区或语言中可能并不适用。因此，它是一个完全本土化的中文测试基准。

相关导航

生物医学研究问答数据集和模型得分排行榜

一个全面的中文基础模型评估套件

H2O EvalGPT

H2O.ai推出的基于Elo评级方法的大模型评估系统

智源研究院推出的FlagEval（天秤）大模型评测平台

全方位的多模态大模型能力评测体系

OpenCompass

上海人工智能实验室推出的大模型开放评测体系

暂无评论

您必须登录才能参与评论！

立即登录

暂无评论...

GoodNav - 发现优质资源网站，探索无限可能！我们精选全球设计、编程、AI、站长、游戏、工具、搜索、百科、生活、教育、娱乐等优质资源网站，助你提升效率，开启精彩网络世界！

友链申请免责声明广告合作关于我们

Copyright © 2022-2024 goodnav.net All Rights Reserved