谷歌新规引担忧：消息称外包人员被迫评估自己不擅长的 Gemini 回复

925 0 0

GoodNav 12 月 19 日报道，根据 TechCrunch 提供的信息，谷歌对其大型语言模型 Gemini 的外包评估流程进行了修改，这引发了外界对其在敏感领域信息准确性的新担忧。这一调整规定外包评估员不能再像以前那样，因缺乏专业知识而跳过某些特定评估任务，这可能使 Gemini 在医疗等高度专业化领域的信息输出出现偏差。

为提升 Gemini 的表现，谷歌与外包公司日立的 GlobalLogic 合作，由后者的合同工负责评估人工智能生成的回答，评估标准包括“真实性”等多个维度。以往，如果评估员发现某个问题超出了其专业知识范围，例如涉及心脏病学的问题，而评估员又没有相关的科学背景，他们可以选择“跳过”该问题，以避免不准确的评估。

但上周，GlobalLogic 宣布接到来自谷歌的变更通知：评估员不能再因专业知识不足而跳过任何提示。内部消息显示，之前的指导方针是：“如果您没有评估此提示所需的关键专业知识（如编码、数学），请跳过此任务。”而新的要求则是：“您不应跳过需要特定领域知识的提示。”改为评估员需“评估自己能理解的提示部分”，并标明自己在相关领域的知识不足。

此项变更引起了对 Gemini 在某些主题上准确性的严重担忧，因为现在评估员有时必须评估一些他们完全不熟悉的、十分专业的技术性人工智能回复，例如关于罕见疾病的提问。一位合同工在内部交流中表示：“我以为跳过是为了提高准确性，将其交给更专业的人来处理？”

根据新的指导方针，评估员现在仅能在两种情况下跳过提示：一是提示或回复“完全缺失信息”，二是提示中包含需要特殊同意书才能评估的有害内容。

这一新规的实施意味着在一些专业要求极高的领域，例如医疗健康，将由缺乏相关背景知识的评估员进行评估，这无疑增加了 Gemini 输出不准确信息的风险。外界普遍担心，这一举措可能误导用户，尤其是在涉及健康等重要主题时，不准确的信息可能造成严重后果。

截至发稿时，谷歌尚未对此报道作出回复。

# AI前沿资讯