SuperCLUE 是一个中文通用的大型模型综合评测基准,从三个不同的维度来评估模型的能力:基础能力、专业能力和中文特性能力。
基础能力包括语义理解、对话、逻辑推理、角色模拟、代码执行、生成与创作等10项技能。
专业能力涵盖中学、大学及职业考试,涉及数学、物理、地理到社会科学等50多项技能。
中文特性能力则针对具有中文特色的任务,包括中文成语、诗歌、文学、字形等10种能力。
相关导航
暂无评论...
SuperCLUE 是一个中文通用的大型模型综合评测基准,从三个不同的维度来评估模型的能力:基础能力、专业能力和中文特性能力。
基础能力包括语义理解、对话、逻辑推理、角色模拟、代码执行、生成与创作等10项技能。
专业能力涵盖中学、大学及职业考试,涉及数学、物理、地理到社会科学等50多项技能。
中文特性能力则针对具有中文特色的任务,包括中文成语、诗歌、文学、字形等10种能力。