C-Eval是一个为大语言模型设计的中文评估工具,具备多层次和多学科特性,由上海交通大学、清华大学及爱丁堡大学的研究团队于2023年5月共同发布。该工具包含13948道多选题,涵盖52个不同学科以及四个难度级别,旨在评估大模型的中文理解能力。
相关导航
暂无评论...
C-Eval是一个为大语言模型设计的中文评估工具,具备多层次和多学科特性,由上海交通大学、清华大学及爱丁堡大学的研究团队于2023年5月共同发布。该工具包含13948道多选题,涵盖52个不同学科以及四个难度级别,旨在评估大模型的中文理解能力。