Workflow
DeepSeek上新!首个奥数金牌水平的模型来了

"鲸鱼"回来了。 11月27日晚,DeepSeek悄悄地在Hugging Face 上开源了一个新模型:DeepSeek-Math-V2。这是一个数学方面的模型,也是目前行业首个达到IMO(国际奥林 匹克数学竞赛)金牌水平且开源的模型。 在同步发布的技术论文中,DeepSeek表示,Math-V2的部分性能优于谷歌旗下的Gemini DeepThink,并展示了模型在IMO-ProofBench基准以及近期数学竞赛 上的表现。 | Contest Problems | Points | | --- | --- | | IMO 2025 P1, P2, P3, P4, P5 83.3% | | | CMO 2024 P1 , P2 , P4 , P5 , P6 | 73.8% | | Putnam 2024 A1 ~ B4 , B5, B6 | 98.3% | 具体来看,在其中的Basic基准上,DeepSeek-Math-V2 远胜其他模型,达到了近99%的高分,而排在第二的谷歌旗下Gemini Deep Think (IMO Gold)分数为 89%。但在更难的 Advanced 子集上,Math-V2分数 ...