Loading...

C-Eval

AI人工智能AI模型评测

C-Eval

一个全面的中文基础模型评估套件

标签：AI模型评测AI模型评测

链接直达手机查看

C-Eval是一个为大语言模型设计的中文评估工具，具备多层次和多学科特性，由上海交通大学、清华大学及爱丁堡大学的研究团队于2023年5月共同发布。该工具包含13948道多选题，涵盖52个不同学科以及四个难度级别，旨在评估大模型的中文理解能力。

相关导航

一个综合性的大模型中文评估基准

OpenCompass

上海人工智能实验室推出的大模型开放评测体系

Chatbot Arena

以众包方式进行匿名随机对战的LLM基准平台

斯坦福大学推出的大模型评测体系

智源研究院推出的FlagEval（天秤）大模型评测平台

由复旦大学NLP实验室推出的大模型评测基准

暂无评论

您必须登录才能参与评论！

立即登录

暂无评论...

GoodNav - 发现优质资源网站，探索无限可能！我们精选全球设计、编程、AI、站长、游戏、工具、搜索、百科、生活、教育、娱乐等优质资源网站，助你提升效率，开启精彩网络世界！

友链申请免责声明广告合作关于我们

Copyright © 2022-2024 goodnav.net All Rights Reserved