Loading...

LLMEval3

AI人工智能AI模型评测

LLMEval3

由复旦大学NLP实验室推出的大模型评测基准

标签：AI模型评测AI模型评测

链接直达手机查看

LLMEval是复旦大学NLP实验室开发的一种大模型评测基准，最新版本LLMEval-3专注于专业知识能力的评估，涵盖了哲学、经济学、法学、教育学、文学、历史学、理学、工学、农学、医学、军事学、管理学、艺术学等教育部规定的13个学科及50多个二级学科，总计约20万道标准生成式问答题。

相关导航

全方位的多模态大模型能力评测体系

H2O EvalGPT

H2O.ai推出的基于Elo评级方法的大模型评估系统

AI大模型评测社区

一个综合性的大模型中文评估基准

中文通用大模型综合性测评基准

智源研究院推出的FlagEval（天秤）大模型评测平台

暂无评论

您必须登录才能参与评论！

立即登录

暂无评论...

GoodNav - 发现优质资源网站，探索无限可能！我们精选全球设计、编程、AI、站长、游戏、工具、搜索、百科、生活、教育、娱乐等优质资源网站，助你提升效率，开启精彩网络世界！

友链申请免责声明广告合作关于我们

Copyright © 2022-2024 goodnav.net All Rights Reserved