谷歌(GOOGL.US)突然发布Gemini 3.1 Pro:核心推理性能直接翻倍
AlphabetAlphabet(US:GOOGL) 智通财经网·2026-02-20 01:11

相比去年十一月发布的 Gemini 3 Pro,新模型推理性能直接翻倍。 在评估模型破解全新逻辑范式能力的 ARC-AGI-2 评测中,Gemini 3.1 Pro拿下 77.1%的得分(而 3 Pro 测试成绩为 31.1%),大多数推理任务重都是SOTA,代码 能力无限接近opus 4.6,SWE-Bench验证80.6%,非常接近Opus 4.6的80.8%,看起来很强,但这些数据看看就好了,实际使用才能真正检验,相信大家很快 就会得出结论。 | Benchmark | | Gemini 3.1 Pro | Gemini 3 Pro | Sonnet 4.6 | Opus 4.6 | GPT-5.2 | | --- | --- | --- | --- | --- | --- | --- | | | | Thinking (High) | Thinking (High) | Thinking (Max) | Thinking (Max) | Thinking (x) | | Humanity's Last Exam | No tools | 44.4% | 37.5% | 33.2% | 40.0% | ...