Workflow
全网苦等GPT-5,超级对齐团队遗作成重要线索,奥特曼发话「惊喜很多」
3 6 Ke·2025-08-04 03:28

那么,在等待的过程中,我们来看看这次 GPT-5 的「疑似王牌」之一:通用验证器(universal verifier)。 最近整个 AI 圈的目光似乎都集中在 GPT-5 上,相关爆料满天飞,但模型迟迟不见踪影。 我们报道了 The Information 扒出的 GPT-5长文内幕,奥特曼似乎也坐不住,发了推文表示「惊喜很多,值得等待」。 据知情人士透露,OpenAI 一直在开发一种研究人员称之为「通用验证器」的东西,这个东西可能是 GPT-5 中用到的重要技术。 这个概念源于 OpenAI 去年发表的一篇论文。它解决的问题是:当 LLM 仅优化答案正确性时,其推理过程(如 Chain-of-Thought)变得难以被人类或小型 模型理解和验证,导致「可解释性」下降。但在高风险应用中,用户需要能快速、准确判断模型输出是否正确,而不仅是输出答案本身。 为此,该论文提出了一套已准备好投入生产的技术管线,其核心在于:让一个「验证者」小模型来为「证明者」大模型的推理链打分,并将其作为奖励信 号反馈给大模型进行策略更新。 论文标题:Prover-Verifier Games improve legibility o ...