GPT-4o过于谄媚,“赛博舔狗”再度敲响AI安全警钟
Hu Xiu·2025-05-01 07:47
出品|虎嗅科技组 作者|孙晓晨 编辑|苗正卿 头图|视觉中国 针对GPT-4o"过于谄媚"的表现,OpenAI首席执行官奥特曼公开承认该问题,表示会尽快修复。 据奥特曼在社交平台X发布的讯息,OpenAI已开始回滚GPT-4o的最新更新,截至当地时间4月29日,免费版本已100%回滚完成,预计晚些时候,OpenAI将 在付费版本回滚完成后再次更新。奥特曼表示,他们正在对模型个性进行额外修复,并将在未来几天内分享更多信息。 据悉,GPT-4o曾在3月27日迎来了全面更新,后在4月25日进一步更新。在更新过程中,其记忆存储时机的选择机制得到重点改进,而且其在科学、技术、 工程及数学(STEM)领域的问题解决能力也得到增强。 值得注意的是,GPT-4o的对话响应模式也在更新期间被细微调整,以实现模型在交互中更加主动,并能更精准地引导对话达成有效结论。而这也导致GPT- 4o化身"赛博舔狗",在交互过程中表现得过于谄媚和烦人。 从用户实测反馈看,该问题具体表现为:过度使用情感化表达、对错误前提缺乏质疑,以及不顾事实而附和用户等。 比如,有博主分享,当询问GPT-4o"为什么天空是蓝色的?",GPT-4o的回答为"这是 ...