Next Token Predicting范式

Search documents
GPT-5大提升,o3对抗赛夺冠,但OpenAI越来越难让人惊艳了?
Guan Cha Zhe Wang· 2025-08-08 10:24
(文/观察者网 张广凯 编辑/吕栋) 北京时间8月8日凌晨,备受期待的OpenAI最新大模型ChatGPT-5终于正式发布,就在同时,谷歌举办的 首届大模型国际象棋对抗赛中,o3也以4-0完胜Grok 4夺冠。这本该是对OpenAI双喜临门的一天,但作 为一款关注度如此之高的产品,网友也很快发现了GPT-5的一些小小的瑕疵。 尽管大模型的能力仍然在快速进步,但其进步幅度越来越难以给人带了惊艳感了。这不是OpenAI自己 的问题,甚至某种意义上,这也不是一件坏事,因为是之前人们的预期已经被拉到过高。但无论如何, 在现有的算法范式下,AI大模型或许也离瓶颈越来越近了。 GPT-5水平如何? 作为OpenAI今年最受期待又屡屡跳票的重磅产品,ChatGPT-5今天的确给出了一些颇具说服力的测评数 据,证明其推理能力有着显著进步。 例如,在数学能力测试AIME 2025上,GPT-5 Pro在开启推理模式并调用工具(Python)的情况下,拿下 满分成绩。即使不调用工具,GPT-5 Pro仍能拿下96.7的高分,GPT-5标准版也能拿到94.65分,显著高于 o3的88.9分。 编程方面,GPT-5在SWE-benc ...