开源最强！“拳打GPT 5”，“脚踢Gemini-3.0”，DeepSeek V3.2为何提升这么多？

V3.2在工具调用能力上达到当前开源模型最高水平，大幅缩小了开源模型与闭源模型的差距。作为DeepSeek首个将思考融入工具使用的模型，V3.2 在"思考模式"下仍然支持工具调用。公司通过大规模Agent训练数据合成方法，构造了1800多个环境、85000多条复杂指令的强化学习任务，大幅提升了模型在智能体评测中的表现。在大模型赛道逐渐从"参数竞赛"走向"能力竞赛"的当下，一个显著的变化正在发生：开源模型开始在越来越多关键能力维度上逼近、甚至冲击顶级闭源模型。 12月1日，DeepSeek同步发布两款正式版模型—— DeepSeek-V3.2 与 DeepSeek-V3.2-Speciale ，前者在推理测试中达到GPT-5水平，仅略低于 Gemini-3.0-Pro，而后者在IMO 2025等四项国际顶级竞赛中斩获金牌。 V3.2在工具调用能力上达到当前开源模型最高水平，大幅缩小了开源模型与闭源模型的差距。据官方介绍， V3.2是DeepSeek首个将思考融入工具使用的模型，在"思考模式"下仍然支持工具调用。该公司通过大规模Agent训练数据合成方法，构造了1800多个环境、85000多条复杂指令的 ...