谷歌IMO金牌模型可以用了!推理性能秒了o3、Grok 4
金磊 发自 凹非寺 量子位 | 公众号 QbitAI 谷歌拿下IMO(国际数学奥林匹克竞赛)金牌的模型—— Gemini 2.5 Deep Think ,现在可以用起来了。 并且这个发布的版本,跟拿下IMO金牌的版本还有略微的区别。 之前的模型需要好几个小时才能解决复杂的数学问题,但App中发布的版本,速度会更快,实用性也会更强。 但相对的,实力定然不如之前的"完全体",不过同样是拿IMO'25的试题实验,可以达到铜牌的水平。 DeepMind在发布Gemini 2.5 DeepThink之际,还拉来了数学家Michel van Garrel来站台: 当我问它一个猜想,我大概有三个思路,但它似乎在考虑20甚至100个 不过这个模型只对Ultra的订阅用户开放,每月订阅费为249.99美元,折合人民币约 1803元 。 推理性能超越o3、Grok 4 除了"发布"的动作之外,DeepMind这次还秀了一波推理性能的肌肉,对标的选手是OpenAI的o3和马斯克的Grok 4。 根据谷歌DeepMind的最新消息,这个模型已经在Gemini App中推出。 主要考量的能力聚焦在了编码、科学、知识和推理能力上。 结果 ...