GPT-5.2已上线24小时:差评如潮!
机器之心·2025-12-13 04:59
机器之心报道 编辑:杨文 网友吐槽GPT-5.2「不通人性」。 X 上充斥着对 GPT-5.2 的恶评。 昨天,OpenAI 十周年之际,拿出了 最新的顶级模型 GPT-5.2 系列 ,官方号称是「迄今为止在专业知识工作 上最强大的模型系列」,在众多基准测试中,GPT-5.2 也都刷新了最新的 SOTA 水平。 | | GPT-5.2 Thinking | GPT-5.1 Thinking | | --- | --- | --- | | GDPval (wins or ties) | 70.9% | 38.8% (GPT-5) | | Knowledge work tasks | | | | SWE-Bench Pro (public) | 55.6% | 50.8% | | Software engineering | | | | SWE-bench Verified | 80.0% | 76.3% | | Software engineering | | | | GPQA Diamond (no tools) | 92.4% | 88.1% | | Science questions | | | | Ch ...