Loading...

谷歌新规引担忧:消息称外包人员被迫评估自己不擅长的 Gemini 回复

GoodNav 12 月 19 日报道,根据 TechCrunch 提供的信息,谷歌对其大型语言模型 Gemini 的外包评估流程进行了修改,这引发了外界对其在敏感领域信息准确性的新担忧。这一调整规定外包评估员不能再像以前那样,因缺乏专业知识而跳过某些特定评估任务,这可能使 Gemini 在医疗等高度专业化领域的信息输出出现偏差。

谷歌新规引担忧:消息称外包人员被迫评估自己不擅长的 Gemini 回复

为提升 Gemini 的表现,谷歌与外包公司日立的 GlobalLogic 合作,由后者的合同工负责评估人工智能生成的回答,评估标准包括“真实性”等多个维度。以往,如果评估员发现某个问题超出了其专业知识范围,例如涉及心脏病学的问题,而评估员又没有相关的科学背景,他们可以选择“跳过”该问题,以避免不准确的评估。

但上周,GlobalLogic 宣布接到来自谷歌的变更通知:评估员不能再因专业知识不足而跳过任何提示。内部消息显示,之前的指导方针是:“如果您没有评估此提示所需的关键专业知识(如编码、数学),请跳过此任务。”而新的要求则是:“您不应跳过需要特定领域知识的提示。”改为评估员需“评估自己能理解的提示部分”,并标明自己在相关领域的知识不足。

此项变更引起了对 Gemini 在某些主题上准确性的严重担忧,因为现在评估员有时必须评估一些他们完全不熟悉的、十分专业的技术性人工智能回复,例如关于罕见疾病的提问。一位合同工在内部交流中表示:“我以为跳过是为了提高准确性,将其交给更专业的人来处理?”

根据新的指导方针,评估员现在仅能在两种情况下跳过提示:一是提示或回复“完全缺失信息”,二是提示中包含需要特殊同意书才能评估的有害内容。

这一新规的实施意味着在一些专业要求极高的领域,例如医疗健康,将由缺乏相关背景知识的评估员进行评估,这无疑增加了 Gemini 输出不准确信息的风险。外界普遍担心,这一举措可能误导用户,尤其是在涉及健康等重要主题时,不准确的信息可能造成严重后果。

截至发稿时,谷歌尚未对此报道作出回复。

© 版权声明

相关文章

暂无评论

您必须登录才能参与评论!
立即登录
暂无评论...