Gemini DeepThink
Search documents
“在数学上,中国模型没输过”!DeepSeek 深夜屠榜,Math V2 以碾压姿态终结“最强数学模型”之争
AI前线· 2025-11-28 02:54
整理|冬梅 11 月 27 日晚,DeepSeek 在毫无预告的情况下,于 Hugging Face 和 GitHub 上开源了全新数学推理模型 DeepSeek-Math-V2,685B 参数,从模型名 称就可以直接分辨出这是一款专注于数学方面的模型。这是业内首个达到国际奥林匹克数学竞赛(IMO)金牌水平且全面开源的数学模型,一经发布便 引发全球学界与开发者的高度关注。 它的上一个版本 ——DeepSeek-Math-7B 还是一年多以前发的。当时,这个模型只用 7B 参数量,就达到了 GPT-4 和 Gemini-Ultra 性能相当的水平。 模型地址: https://huggingface.co/deepseek-ai/DeepSeek-Math-V2 https://github.com/deepseek-ai/DeepSeek-Math-V2 数学能力击败 Gemini DeepThink 那么,这款模型性能到底如何? 据 DeepSeek 官方介绍,在性能方面,DeepSeek-Math-V2 在权威基准 IMO-ProofBench 中表现突出。 在 Basic 子集上,该模型拿下近 99% ...
DeepSeek上新,“奥数金牌水平”
Di Yi Cai Jing· 2025-11-28 00:40
11月27日晚,DeepSeek悄悄地在Hugging Face 上开源了一个新模型:DeepSeek-Math-V2。这是一个数学 方面的模型,也是目前行业首个达到IMO(国际奥林匹克数学竞赛)金牌水平且开源的模型。 在同步发布的技术论文中,DeepSeek表示,Math-V2的部分性能优于谷歌旗下的Gemini DeepThink,并 展示了模型在IMO-ProofBench基准以及近期数学竞赛上的表现。 炒股就看金麒麟分析师研报,权威,专业,及时,全面,助您挖掘潜力主题机会! | Contest Problems | | Points | | --- | --- | --- | | IMO 2025 | P1, P2, P3, P4, P5 83.3% | | | CMO 2024 | P1, P2, P4, P5, P6 | 73.8% | | Putnam 2024 A1 ~ B4 , B5, B6 | | 98.3% | 具体来看,在其中的Basic基准上,DeepSeek-Math-V2 远胜其他模型,达到了近99%的高分,而排在第 二的谷歌旗下Gemini Deep Think (IMO Go ...
DeepSeek上新,“奥数金牌水平”
第一财经· 2025-11-28 00:35
2025.11. 28 在同步发布的技术论文中,DeepSeek表示,Math-V2的部分性能优于谷歌旗下的Gemini DeepThink,并展示了模型在 IMO-ProofBench基准以及近期数学竞赛上的表现。 本文字数:1072,阅读时长大约2分钟 作者 | 第一财经 刘晓洁 11月27日晚,DeepSeek悄悄地在Hugging Face 上开源了一个新模型:DeepSeek-Math-V2。这是一个数学方面的模 型,也是目前行业首个达到IMO(国际奥林匹克数学竞赛)金牌水平且开源的模型。 具体来看,在其中的Basic基准上,DeepSeek-Math-V2 远胜其他模型,达到了近99%的高分,而排在第二的谷歌旗下 Gemini Deep Think (IMO Gold)分数为89%。但在更难的 Advanced 子集上,Math-V2分数为61.9%,略逊于 Gemini Deep Think (IMO Gold)的65.7%。 在这篇名为《DeepSeek Math-V2:迈向可自验证的数学推理》的论文中,DeepSeek指出,大语言模型已经在数学推理 方面取得了重大进展,这是人工智能的重要试验 ...
DeepSeek上新!首个奥数金牌水平的模型来了
Di Yi Cai Jing· 2025-11-28 00:22
"鲸鱼"回来了。 11月27日晚,DeepSeek悄悄地在Hugging Face 上开源了一个新模型:DeepSeek-Math-V2。这是一个数学方面的模型,也是目前行业首个达到IMO(国际奥林 匹克数学竞赛)金牌水平且开源的模型。 在同步发布的技术论文中,DeepSeek表示,Math-V2的部分性能优于谷歌旗下的Gemini DeepThink,并展示了模型在IMO-ProofBench基准以及近期数学竞赛 上的表现。 | Contest Problems | Points | | --- | --- | | IMO 2025 P1, P2, P3, P4, P5 83.3% | | | CMO 2024 P1 , P2 , P4 , P5 , P6 | 73.8% | | Putnam 2024 A1 ~ B4 , B5, B6 | 98.3% | 具体来看,在其中的Basic基准上,DeepSeek-Math-V2 远胜其他模型,达到了近99%的高分,而排在第二的谷歌旗下Gemini Deep Think (IMO Gold)分数为 89%。但在更难的 Advanced 子集上,Math-V2分数 ...