Loading...

PubMedQA

AI人工智能AI模型评测

PubMedQA

生物医学研究问答数据集和模型得分排行榜

标签：AI模型评测AI模型评测

链接直达手机查看

PubMedQA是一个用于生物医学研究的问答数据集，包含1K由专家标注的实例、61.2K未标注的实例以及211.3K个人工生成的问答实例。目前，该排行榜已记录18个模型在医学测试中的得分。

相关导航

AI大模型评测社区

OpenCompass

上海人工智能实验室推出的大模型开放评测体系

由复旦大学NLP实验室推出的大模型评测基准

斯坦福大学推出的大模型评测体系

智源研究院推出的FlagEval（天秤）大模型评测平台

中文通用大模型综合性测评基准

暂无评论

您必须登录才能参与评论！

立即登录

暂无评论...

GoodNav - 发现优质资源网站，探索无限可能！我们精选全球设计、编程、AI、站长、游戏、工具、搜索、百科、生活、教育、娱乐等优质资源网站，助你提升效率，开启精彩网络世界！

友链申请免责声明广告合作关于我们

Copyright © 2022-2024 goodnav.net All Rights Reserved