刚刚Gemini上新模型,全球只有7人比它会编程,谷歌姚顺宇参与
机器之心·2026-02-13 01:02
编辑|泽南 从此以后,AI 不再是工具,要尊称为「硅基博学家」了。 北京时间周五凌晨,谷歌发布了 Gemini 3 Deep Think 的重大升级,作为专门用于复杂任务的推理模式,Deep Think 代表 AI 前沿的最强智能水平,旨在 解决科学、工程领域的诸多挑战。 去年 9 月加入 Google DeepMind 的清华物理系传奇姚顺宇( Shunyu Yao )也是这次 Deep Think 新模型的参与者。 去年,谷歌展示了专门开发的 Deep Think 版本能够成功应对一些最棘手的推理挑战,并在数学和编程世界锦标赛上取得了金牌成绩。最近,Deep Think 又使专门开发的智能体能够进行研究级别的数学探索。 更新后的深度思考模式继续拓展智能的边界,在最严格的学术基准测试中取得了新的高度,其中包括: 在「人类的最后考试」(一项旨在测试现代前沿模型极限的基准测试)中,该模型取得了新的 SOTA(48.4%,不使用任何工具)。 在 ARC-AGI-2 测试中取得了前所未有的 84.6% 的成绩,并经 ARC Prize 基金会验证。 在 Codeforces 上取得了惊人的 3455 Elo 分数, ...