谷歌 Gemini 3.1 Pro 屠榜封神,清华姚顺宇出手!Claude 和 GPT 被逼入死角
程序员的那些事·2026-02-20 03:05

【导读】 谷歌DeepMind深夜扔出核弹,下一代Gemini 3.1 Pro正式登场。在公认的最难ARC-A GI-2测试中,它拿下最高分直接看呆硅谷,推理狂飙2倍,直接把Claude 4.6拉下王座。 Gemini 3 Pro之后,谷歌DeepMind终于祭出杀招! 刚刚, 下一代旗舰模型Gemini 3.1 Pro深夜炸场 ,直接刷爆全领域的SOTA,成为AI新王。 转自: 新智元 | Benchmark | | Gemini 3.1 Pro | Gemini 3 Pro | Sonnet 4.6 | Opus 4.6 | GPT-5.2 | GPT-5.3-Codex | | --- | --- | --- | --- | --- | --- | --- | --- | | | | Thinking (High) | Thinking (High) | Thinking (Max) | Thinking (Max) | Thinking (xhigh) | Thinking (xhigh) | | Humanity's Last Exam Academic reasoning | No tools | ...

谷歌 Gemini 3.1 Pro 屠榜封神,清华姚顺宇出手!Claude 和 GPT 被逼入死角 - Reportify