别再把 Gemini 3 当作更强的 ChatGPT
Gemini 3 Pro 预览版上线那一刻,很多人心里的第一反应可能是: 终于来了 。 遛了将近一个月,这里暗示那里路透:参数更强一点、推理更聪明一点、出图更花一点,大家已经看得心痒痒了。再加上 OpenAI、Gork 轮番出来狙击, 更加是证实了 Gemini 3 将是超级大放送。 模型升级这一块的,Google 已经把话说得很满了 先快速把「硬指标」过一遍,免得大家心里没数。 | Benchmark | Description | | Gemini 3 Pro | Gemini 2.5 Pro | Claude Sonnet 4.5 | GPT-5.1 | | --- | --- | --- | --- | --- | --- | --- | | Humanity's Last Exam | Academic reasoning | No tools | 37.5% | 21.6% | 13.7% | 26.5% | | | | With search and code execution | 45.8% | - | - | - | | ARC-AGI-2 | Visual reasoning puzzl ...