ChatGPT三周年遭DeepSeek暴击,23页技术报告藏着开源登顶的全部秘密
36氪·2025-12-02 09:19

DeepSeek V3.2上新黑科技。 来源| APPSO(ID:appsolution) 封面来源 | unsplash ChatGPT诞生三周年之际,DeepSeek送上「庆生礼物」。 12月1日, DeepSeek一口气发布两款模型:DeepSeek-V3.2和DeepSeek-V3.2-Speciale。这两个模型不仅在推理能力上直逼GPT-5和Gemini-3.0-Pro ,更重 要的是,它们解决了一个困扰开源模型很久的问题: 过去几个月,AI圈出现了一个明显的趋势:闭源模型越跑越快,开源模型却有点跟不上节奏了。DeepSeek团队分析后发现,开源模型在处理复杂任务时有 三个核心瓶颈:架构问题、资源分配以及智能体能力。 针对这三个问题,DeepSeek这次拿出了三个大招。 如果你用过一些AI模型处理超长文档,可能会发现速度越来越慢,甚至直接卡死。这就是传统注意力机制的锅。 怎么让AI既会深度思考,又会熟练使用工具? 新模型省流版如下: DeepSeek-V3.2(标准版) :主打性价比与日常使用,推理能力达到GPT-5水平,比Kimi-K2-Thinking输出更短、更快且更省成本,并首次实现「边思 ...