标签:SimpleQA

OpenAI 开源 SimpleQA 新基准,专治大模型“胡言乱语”

10 月 31 日消息,当地时间 30 日,OpenAI 宣布,为了衡量语言模型的准确性,将开源一个名为 SimpleQA 的新基准,可衡量语言模型回答简短的事实寻求(fact-se...