刚刚Gemini上新模型，全球只有7人比它会编程，谷歌姚顺宇参与

编辑｜泽南从此以后，AI 不再是工具，要尊称为「硅基博学家」了。北京时间周五凌晨，谷歌发布了 Gemini 3 Deep Think 的重大升级，作为专门用于复杂任务的推理模式，Deep Think 代表 AI 前沿的最强智能水平，旨在解决科学、工程领域的诸多挑战。去年 9 月加入 Google DeepMind 的清华物理系传奇姚顺宇（ Shunyu Yao ）也是这次 Deep Think 新模型的参与者。去年，谷歌展示了专门开发的 Deep Think 版本能够成功应对一些最棘手的推理挑战，并在数学和编程世界锦标赛上取得了金牌成绩。最近，Deep Think 又使专门开发的智能体能够进行研究级别的数学探索。更新后的深度思考模式继续拓展智能的边界，在最严格的学术基准测试中取得了新的高度，其中包括：在「人类的最后考试」（一项旨在测试现代前沿模型极限的基准测试）中，该模型取得了新的 SOTA（48.4%，不使用任何工具）。在 ARC-AGI-2 测试中取得了前所未有的 84.6% 的成绩，并经 ARC Prize 基金会验证。在 Codeforces 上取得了惊人的 3455 Elo 分数， ...