DeepSeek上新:开源模型首达IMO金牌水平,AI推理告别“死记硬背”

在OpenAI发布GPT-5.1、谷歌推出Gemini 3系列的背景下,国内AI独角兽DeepSeek虽然迟迟未能带来基 座模型的大更新,但也于本周三晚间低调发布了其最新的技术成果DeepSeek-Math-V2。 据官方披露的技术报告显示,DeepSeek-Math-V2拥有685B参数量,专注于提升大语言模型的数学推理 与定理证明能力。在多项高难度数学竞赛基准中,该模型交出了一份极具冲击力的成绩单。 首先是顶尖竞赛表现,在2025年国际数学奥林匹克竞赛(IMO 2025)和2024年中国数学奥林匹克竞赛 (CMO 2024)中,Math-V2均达到了金牌水平。特别是在被称为"数学界炼狱"的普特南(Putnam 2024)数学竞赛中,通过扩展测试计算(Test-time Compute),该模型取得了118分(满分120分)的近 乎满分成绩,远超人类选手约90分的历史最高分记录。 | Contest | Problems | Points | | --- | --- | --- | | IMO 2025 | P1, P2, P3, P4, P5 83.3% | | | CMO 2024 | P1 , P2 ...