Workflow
证明者 - 验证者游戏
icon
Search documents
大模型下一个飞跃?OpenAI的“新突破”:通用验证器
Hua Er Jie Jian Wen· 2025-08-05 06:07
在下一代大模型GPT-5备受期待之际,一项名为"通用验证器"的新技术正浮出水面,揭示了OpenAI可能 用于拉开竞争差距的"秘密武器"。 OpenAI的"通用验证器"或将直接影响GPT-5模型的市场竞争力,8月4日据科技媒体The Information援引 知情人士消息报道,这项技术已被应用于GPT-5的开发过程中。 该技术的核心机制,被比作一场"证明者-验证者游戏"。简而言之,它让一个AI模型扮演"验证者"的角 色,去检查和评判另一个"证明者"模型生成的答案。通过这种内部对抗和反馈,系统性地提升模型的输 出质量。这一自动化流程旨在解决强化学习(RL)在创意写作等主观领域或数学证明等复杂领域难以 验证的瓶颈。 OpenAI内部研究人员已在社交平台X上间接证实了相关方法的有效性。研究员Noam Brown表示,这些 技术是"通用的",能让大模型"在难以验证的任务上表现得更好"。这也标志着OpenAI正试图攻克AI商 业化应用中的核心痛点——可信度。 "证明者-验证者"的对抗游戏 "通用验证器"的技术细节,最早在OpenAI于2024年7月发表的一篇题为《证明者-验证者游戏提升大语言 模型可读性》的论文中被阐述 ...
奥特曼首晒GPT-5实测!被曝使用超级对齐团队“遗产”
量子位· 2025-08-04 03:07
鱼羊 鹭羽 发自 凹非寺 量子位 | 公众号 QbitAI GPT-5,终于亮出真容! 最新实测,由奥特曼本人带来,迅速引发大量围观。 疯狂暗示了一周之后,虽说对话只是围绕电视剧推荐,但好歹是有 官方实例 了。 当然奥特曼其人,放料的同时还是少不了新的谜语┓( ´∀` )┏: 即将进入SaaS快时尚时代。 比起这种奥式基操,更令人兴奋的是,这次有眼疾手快的网友,截到了 发布时间(秒删版) ??? 行吧,这一周的夜,熬起来吧伙计们。 更多细节"泄露"ing 奥特曼持续的官方放料之外,关于GPT-5,零零星星的各路消息也正在被归纳总结出更多关键脉络。 比如,在主要竞争对手Claude一骑当先的编程领域,GPT-5被曝重写了编码规则。 首先,是将文本能力与推理层相结合,模型学会更合理地选择何时"努力"思考。 其次,GPT-5具备处理真实工程问题的能力,比如,重构"屎山"代码…… 更值得关注的是,有知情人士透露,GPT-5还用上了Ilya领衔的超级对齐团队的"遗产"—— 通用验证器 (Universal Verifier)。 八卦少叙,还是来看看 "通用验证器" 的具体作用。 消息称,OpenAI在开发GPT-5的过 ...