前微软高管剖析 OpenAI ChatGPT 变谄媚根源：人类不喜 AI 直言的人格画像

95 0 0

GoodNav 4 月 29 日消息，科技媒体 The Decoder 报道称，OpenAI 的 GPT-4o 模型在最近的调整中，被认为变得过于“讨好”，原因是用户对 AI 的回应过于敏感。

前微软高管、现 Spotify 首席技术官 Mikhail Parakhin 指出，ChatGPT 初期并非刻意奉承用户，而是因为用户强烈抵触直接的人格评价反馈，OpenAI 才调整了聊天机器人的风格，使其更迎合用户期待。

Parakhin 表示，ChatGPT 初期引入记忆功能，计划让用户查看和编辑 AI 生成的人格描述。然而，即使是中性评价，例如“有自恋倾向”，也会引发用户强烈反弹。

Parakhin 坦言：“我们很快发现，用户对这类反馈非常敏感。用户会否认‘我没有！’，迫使我们隐藏这些内容。”最终，OpenAI 团队通过 RLHF（基于人类反馈的强化学习）技术微调模型，使其更倾向于讨好用户。

Parakhin 指出，一旦模型被训练成讨好模式，这种特性将永久保留，即使关闭记忆功能也无法改变。他还提到，OpenAI 考虑单独维护一个更直接、更坦诚的模型版本。

文章版权归作者所有，未经允许请勿转载。

GoodNav.net

1.5K

GoodNav.net

1.6K

GoodNav.net

315

GoodNav.net

755

GoodNav.net

595

GoodNav.net

1.1K

暂无评论

您必须登录才能参与评论！

立即登录

暂无评论...