谷歌全线开挂!Gemini 3 Deep Think夺多项推理SOTA,Gemini亚洲新团队也官宣了
作者 | 木子、高允毅 刚刚, Gemini 3 的 Deep Think 模式 终于 正式上线 了。 顾名思义,这是 Gemini 3 的深度思考模式, 推理能力显著加强 , 能处理复杂、多步骤,以及更多 创新的问题, 还可以搞定超难的科学问题和数学题! ARC-AGI-2 则将任务升级为多步骤、递归、隐藏规则等,是 更接近"类人智慧"的高阶推理场景 。 其中,Gemini 3 Deep Think 正确率达 45.1% ,比非深度思考模式的 Gemini 3 Pro(正确率 31.1%)高出了 14%。而在这项测试中,GPT-5 Pro 的正确率仅有 18.3% 。 是 ARC-AGI、HLE 等 多项权威测评中的第一名 先来看看 Gemini 3 Deep Think 是怎么一回事。 在公认的大模型最难测试之一、全球 最接近"通用智能(AGI)核心能力"验证 的基准测试 ARC-AGI 中,Gemini 3 Deep Think 在 2 个榜单中均 拔得头筹 。 其中, ARC-AGI-1 主要测 模型的基础抽象推理 。在这项测试中,Gemini 3 Deep Think 的答题正确 率排第一,达到了 ...