GPT-5.2性能爆表,但红色警报没有解除
3 6 Ke·2025-12-12 01:41

虽然在时间上,GPT-5.2只跟5.1相隔了一个月。但是从公布的性能数据来看,GPT-5.2较上一代提升巨大,而且远超谷 歌和Anthropic的同期产品。 就在刚刚,ChatGPT-5.2发布了。 这是OpenAI成立以来,首次发布红色警报(Code Red)后的第一款产品。 然而OpenAI的红色警报并未因此解除,这家公司仍处于危机之中。 究其原因,现在的市场已经逐渐开始对OpenAI祛魅,而是更冷静地审视每一分算力背后的投入产出比。在这种前所未 有的环境之下,OpenAI不仅需要证明自己是最强的,还需要证明自己不可被替代。 01 首先要说的,就是GPT-5.2的数学能力。 长期以来,业界普遍认为大语言模型虽然能写代码、能聊天,但在严格的数学推理上总是差强人意。这次GPT-5.2 Thinking在AIME 2025数学竞赛中拿到了100%的满分。 | | OpenAl | | Anthropic | Google | | --- | --- | --- | --- | --- | | | GPT-5.2 | GPT-5.1 | Claude | Gemini | | | Thinking | Think ...