Workflow
强化学习(reinforcement learning)
icon
Search documents
GPT-5进步有限,o3性能滑坡,OpenAI押注通用验证器 | Jinqiu Spotlight
锦秋集· 2025-08-02 06:16
预热了一周,GPT-5发布在即,大家都十分关注它究竟会有多少进步? 近期The Information的一篇报道披露了一些内幕:GPT-5在编程能力和复杂任务自动化方面有所改进,但整体而言,这种进步更接近实用性方面的优化,而非像GPT- 3到GPT-4那种跃迁。 这背后也反映了OpenAI目前遇到的困难。原本计划作为GPT-5推出的猎户座(GPT-4.5)项目,受限于高质量数据短缺,未达到预期目标。 令人更感意外的是,OpenAI去年底推出的o3预览版曾在多项基准测试中大放异彩,引发轰动,但正式上线聊天版后却明显退步,甚至连顺畅交流都变得困难。 知情人士推测,推理模型的思考方式与人类可能存在差异,若将其训练成聊天模型,反而会导致整体性能的下降。 这使得OpenAI放弃继续推进o系列模型的产品发布,转而开发GPT-5,希望结合o系列的优势与GPT基础架构,解决聊天场景中的瓶颈。 截至今年6月,OpenAI仍未开发出一款足以被称作GPT-5的模型。 不过,近期获得IMO金牌的模型背后,或许藏着下一次重大突破的关键:通用验证器(Universal Verifier)。 OpenAI的通用验证器不仅能验证客观问题的答 ...