Workflow
Gemini Deep Think
icon
Search documents
Altman 秀新模型“翻车”,谷歌补刀躺赢!OpenAI 前员工爆肝3天,编程再赢老东家模型!
AI前线· 2025-07-22 09:32
整理 | 华卫 近期, OpenAI 接连在多个场合携不同新模型"上桌",且这些模型均还未公开发布。上周,OpenAI 分别曝出了两款与 o3 有关联但都未公开过的新模型。其中,一款被疑是"伪装的 GPT-5",另一款则 在一场 AI 模型和人类选手都参与的编程世界锦标赛中拿到了第二名的成绩。 最新上场的是,一款 OpenAI 宣称"在国际数学奥林匹克竞赛(IMO)中取得了金牌级别成绩"的模 型。每年参加国际数学奥林匹克竞赛(IMO)的学生,都是全球范围内极具天赋的年轻数学才俊。今 年,他们迎来了一批实力更强的 AI 模型的挑战。刚刚,谷歌 DeepMind 联合创始人兼 CEO Demis Hassabis 亦宣布,Gemini Deep Think 在 IMO 中达到了金牌水平。 然而,虽然都宣布拿到金牌的成绩,但评价风向却差不少。不少网友认为:"OpenAI 为了博眼球啥 都干得出来。没官方分数,没点耐心,更没底线。""谷歌 DeepMind 的表现堪称典范,非常钦佩。" OpenAI 模型 IMO 输给谷歌? "进步惊人",用 Hassabis 的话来说。谷歌表示,其经过专门优化的数学人工智能在六道题 ...
DeepMind夺得IMO官方「唯一」金牌,却成为OpenAI大型社死现场
机器之心· 2025-07-22 04:25
机器之心报道 机器之心编辑部 今年的突破来自 Gemini Deep Think,这是一个增强型推理系统,采用了研究人员所谓的并行思维。与遵循单一推理链的传统人工智能模型不同,Deep Think 会同 时探索多种可能的解决方案,最终得出答案。 哈萨比斯在后续帖子中解释道:谷歌的模型以自然语言进行端到端运行,直接从官方问题描述中生成严格的数学证明。并强调,该系统在比赛标准的 4.5 小时时限 内完成了任务。 刚刚,谷歌 DeepMind 宣布,其新一代 Gemini 进阶版模型在 IMO 竞赛中正式达到金牌得主水平,成功解决了六道超高难度试题中的五道,拿下 35 分(满分 42 分),成为首个获得奥赛组委会官方认定为金牌的AI系统。 更重要的是,该系统首次证明人工智能无需依赖专业编程语言,仅通过自然语言理解即可攻克复杂数学难题。 谷歌 DeepMind 首席执行官哈萨比斯在社交媒体平台 X 上强调:这是官方结果! 谷歌这项成绩远超其在 2024 年的表现。当时,AlphaProof 和 AlphaGeometry 系统组合解决了六个问题中的四个,荣获银牌。 谷歌这次官宣,让 OpenAI 处于尴尬的处境,毕竟 ...
全球首个IMO金牌AI诞生!谷歌Gemini碾碎奥数神话,拿下35分震惊裁判
猿大侠· 2025-07-22 03:33
转自:新智元 编辑:编辑部 【导读】 谷歌DeepMind奥数夺金了,得到IMO官方认证!新模型Gemini Deep Think仅用自然语言,在4.5小时攻克了5题,拿下35分。这次,具体解题过程也一并公开了。 今天,谷歌DeepMind正式官宣拿下IMO金牌! 他们凭借Gemini Deep Think(高阶版),一个通用模型,成功破解前5题,斩获35分(满分42分)。 而且, AI在极限4.5小时之内,就达到了IMO金牌标准。 最最重要的是,Gemini仅用纯自然语言——英语完成了解题。 与 OpenAI 不同的是,这一结果得到了IMO组委会官方认证。 Demis Hassabis连发两弹,一再强调「谷歌模型是首个获得官方金牌级别认可的AI系统」。 谷歌DeepMind,正式摘金 作为数学界的奥林匹克,IMO自1959年以来每年举办一次,每年吸引了全球各界优秀的学生参与。 参赛者需在4.5小时内解决6道极具深度的数学问题,涵盖代数、几何、组合数学和数论。 而且只有排名前8%的选手才能摘得金牌,象征着无上的学术荣耀。 2024年,AlphaProof和AlphaGeometry 2破解了6题中的4题,获得 ...