Workflow
Model Generalization
icon
Search documents
DeepSeek,上新
DeepSeek表示,在公开的推理类Benchmark测试中,DeepSeek-V3.2达到了GPT-5的水平,仅略低于Gemini-3.0-Pro;相比Kimi-K2-Thinking,V3.2的输出长 度大幅降低,显著减少了计算开销与用户等待时间。 DeepSeek-V3.2-Speciale模型具备出色的指令跟随、严谨的数学证明与逻辑验证能力,在主流推理基准测试上的性能表现媲美Gemini-3.0-Pro。V3.2- Speciale模型在IMO 2025(国际数学奥林匹克)、CMO 2025(中国数学奥林匹克)、ICPC World Finals 2025(国际大学生程序设计竞赛全球总决赛)及 IOI 2025(国际信息学奥林匹克)中取得金牌水平的成绩。其中,ICPC与IOI成绩分别达到人类选手第二名与第十名的水平。 | Benchmark | GPT-5 | Gemini-3.0 | Kimi-K2 | DeepSeek-V3.2 | DeepSeek-V3.2 | | --- | --- | --- | --- | --- | --- | | | High | Pro | Thinking | T ...