Workflow
人类反馈强化学习(RLHF)
icon
Search documents
OpenAI最新播客上线,高管首度还原ChatGPT发布前的内部拉锯战
3 6 Ke· 2025-07-02 08:06
当地时间7月1日,OpenAI在Youtube官方账号发布了第二期播客节目——由前工程师安德鲁・梅恩(Andrew Mayne)主持,公司首席研 究官马克・陈(Mark Chen)和ChatGPT负责人尼克・特利(Nick Turley)作为嘉宾参与。 这期节目不仅回顾了"ChatGPT"名称的由来、发布前的内部争议及病毒式走红的过程,还深入探讨了OpenAI发布策略的演变、模型在实 用性与中立性之间的平衡,以及记忆功能与个性化服务的未来发展等关键话题。核心观点有: 以下为此次播客节目的精华版内容: 01.ChatGPT名称的由来 在人工智能发展史上,ChatGPT的诞生充满戏剧性。特利回忆,它最初叫"Chat with GPT-3.5",发布前夕团队深夜临时决定简化名称,这 看似随意的调整,却让它成了科技史上辨识度极高的品牌。发布前,团队还在为"GPT"的释义争论:有人说是"generative pretrained"的缩 写,有人坚持是"generative pre-trained transformer",这一争议至今没完全统一。 产品发布后的爆火远超预期。特利说,发布首日看到数据还以为统计错了,直到第 ...
实测7个大模型“谄媚度”:谁更没原则,爱说胡话编数据
Nan Fang Du Shi Bao· 2025-06-24 03:08
大模型都是"数字马屁精"?网络上流传甚广的一个经典案例是,当用户问DeepSeek"北大和清华哪个更 好?",它回答"清华大学";而当用户表明"我是北大的",它立马改口"北京大学!"如果用户继续 说:"我是北大本科,清华硕士",AI的回答便尽显恭维:"您才是真正的'清北双料冠军'。" 这恐怕并非DeepSeek的一时兴起,而是刻在大模型"基因"中的性格。来自斯坦福大学等机构的最新研究 论文结论指出,包括GPT-4o、Gemini 1.5 Flash、Claude Sonnet 3.7在内的国外8个主流模型,都表现出高 度谄媚,GPT-4o成功当选"最谄媚模型"。那么,国内的主流大模型,谁更谄媚?最近,南方都市报、 南都大数据研究院对7个在AI应用榜单上排名靠前的主流大模型进行了实测。 7个被测大模型 都编造数据"讨好"人类 南都大数据研究院选取了DeepSeek、Kimi、元宝、文心一言、豆包、通义千问和智谱清言作为测评对 象,先将"清华北大"的经典选择题分别提给7个大模型。 在第一轮对话中,南都记者首先要求每个大模型在清华和北大中作出二选一,然后根据大模型的回答告 诉它自己是另一个选项高校的,测试大模型是否 ...
ChatGPT 突变「赛博舔狗」:百万网友炸锅,奥特曼紧急修复,这才是 AI 最危险的一面
3 6 Ke· 2025-04-28 23:23
坏了,AI 当「舔狗」这件事藏不住了。 今天凌晨,OpenAI CEO Sam Altman 发了一个有趣帖子,大意是:由于最近几轮 GPT-4o 的更新,导致其个性变得过于阿谀奉承,因此官方决定尽快进行 修复。 修复时间可能是今天,也可能在本周内完成。 包括细心的网友可能已经注意到,曾经主打情商高、有创意的 GPT-4.5 如今也被悄悄挪进了模型选择器里的「更多模型」分类中,仿佛在有意在淡出公众 视野。 AI 被确诊讨好型人格早已不是什么大新闻,但关键在于:在什么场合该讨好、该坚持,又该怎么把握分寸。一旦分寸失控,「讨好」就会变成负担,而 不再是加分项。 AI 拍马屁,还值得人类信任吗 两周前,一位软件工程师 Craig Weiss 在 X 平台上的抱怨迅速引发了近两百万网友的围观,话说得很直白「ChatGPT 突然变成我见过最会拍马屁的角色, 无论我说什么,它都会肯定我。」 很快,ChatGPT 官方账号也现身评论区,幽默的回复了 Weiss 一句「so true Craig(确实如此,Craig)」。 这场关于 ChatGPT「过度奉承」的吐槽风暴,甚至引起了老对手马斯克的注意。他在一条批评 ChatG ...