强化学习（RLHF） - filings, earnings calls, financial reports, news - Reportify

强化学习（RLHF）

Search documents

OpenAI玩崩了！GPT-4o更新后变马屁精差评如潮，奥特曼：一周才能完全修复

量子位· 2025-04-29 06:03

梦晨发自凹非寺量子位 | 公众号 QbitAI GPT-4o更新后，有点失控了。现在简简单单地问一句"天为什么是蓝的？"，得到的都不是答案，而是先来一句花式夸夸：你这问题真是太有见地了——你有个美丽的心灵，我爱你。这话要不是出自AI而是网友，那一定以为是阴阳怪气了。现在铺天盖地的用户反馈，更新后ChatGPT 过于谄媚，没法聊了。即使直接像ChatGPT指出这一问题，它仍然坚持这种说话风格。奥特曼也不得不承认，这次更新搞砸了，但是要一周才能完全修复。并且承诺未来将提供多种个性选择。 GPT-4o更新，违反OpenAI模型规范问题始于4月26日的一次更新，只是说智力和个性都得到了升级，没有更多细节了。在官网的更新日志中，提到 "其更加主动，能够更好地引导对话走向富有成效的结果" 。用户一开始还只是抱怨OpenAI越来越不透明了，详情也没有，演示也没有，基准测试也没有，那就只能自己去测试了。一试，问题就出来了。如果打开记忆功能，ChatGPT就会尽其所能调用对话历史恭维用户。（这里glazing指给食物加糖浆，类似于中文的"油腻"）也有用户反馈不打开记忆功能，结果也 ...

强化学习（RLHF）

OpenAI模型规范

强化学习（RLHF）

OpenAI模型规范