Workflow
Self-verification mechanism
icon
Search documents
“在数学上,中国模型没输过”!DeepSeek 深夜屠榜,Math V2 以碾压姿态终结“最强数学模型”之争
AI前线· 2025-11-28 02:54
整理|冬梅 11 月 27 日晚,DeepSeek 在毫无预告的情况下,于 Hugging Face 和 GitHub 上开源了全新数学推理模型 DeepSeek-Math-V2,685B 参数,从模型名 称就可以直接分辨出这是一款专注于数学方面的模型。这是业内首个达到国际奥林匹克数学竞赛(IMO)金牌水平且全面开源的数学模型,一经发布便 引发全球学界与开发者的高度关注。 它的上一个版本 ——DeepSeek-Math-7B 还是一年多以前发的。当时,这个模型只用 7B 参数量,就达到了 GPT-4 和 Gemini-Ultra 性能相当的水平。 模型地址: https://huggingface.co/deepseek-ai/DeepSeek-Math-V2 https://github.com/deepseek-ai/DeepSeek-Math-V2 数学能力击败 Gemini DeepThink 那么,这款模型性能到底如何? 据 DeepSeek 官方介绍,在性能方面,DeepSeek-Math-V2 在权威基准 IMO-ProofBench 中表现突出。 在 Basic 子集上,该模型拿下近 99% ...