SuperCLUE

中文通用大模型综合性测评基准

SuperCLUE 是一个中文通用的大型模型综合评测基准，从三个不同的维度来评估模型的能力：基础能力、专业能力和中文特性能力。

基础能力包括语义理解、对话、逻辑推理、角色模拟、代码执行、生成与创作等10项技能。

专业能力涵盖中学、大学及职业考试，涉及数学、物理、地理到社会科学等50多项技能。

中文特性能力则针对具有中文特色的任务，包括中文成语、诗歌、文学、字形等10种能力。

相关导航

生物医学研究问答数据集和模型得分排行榜

斯坦福大学推出的大模型评测体系

上海人工智能实验室推出的大模型开放评测体系

AI大模型评测社区

智源研究院推出的FlagEval（天秤）大模型评测平台

全方位的多模态大模型能力评测体系

您必须登录才能参与评论！

立即登录

暂无评论...

GoodNav - 发现优质资源网站，探索无限可能！我们精选全球设计、编程、AI、站长、游戏、工具、搜索、百科、生活、教育、娱乐等优质资源网站，助你提升效率，开启精彩网络世界！