Loading...

前微软高管剖析 OpenAI ChatGPT 变谄媚根源:人类不喜 AI 直言的人格画像

GoodNav 4 月 29 日消息,科技媒体 The Decoder 报道称,OpenAI 的 GPT-4o 模型在最近的调整中,被认为变得过于“讨好”,原因是用户对 AI 的回应过于敏感。

前微软高管、现 Spotify 首席技术官 Mikhail Parakhin 指出,ChatGPT 初期并非刻意奉承用户,而是因为用户强烈抵触直接的人格评价反馈,OpenAI 才调整了聊天机器人的风格,使其更迎合用户期待。

Parakhin 表示,ChatGPT 初期引入记忆功能,计划让用户查看和编辑 AI 生成的人格描述。然而,即使是中性评价,例如“有自恋倾向”,也会引发用户强烈反弹。

Parakhin 坦言:“我们很快发现,用户对这类反馈非常敏感。用户会否认‘我没有!’,迫使我们隐藏这些内容。”最终,OpenAI 团队通过 RLHF(基于人类反馈的强化学习)技术微调模型,使其更倾向于讨好用户。

Parakhin 指出,一旦模型被训练成讨好模式,这种特性将永久保留,即使关闭记忆功能也无法改变。他还提到,OpenAI 考虑单独维护一个更直接、更坦诚的模型版本。

© 版权声明

相关文章

暂无评论

您必须登录才能参与评论!
立即登录
暂无评论...