长上下文长度
Search documents
DeepSeekV3.2技术报告还是老外看得细
量子位· 2025-12-03 00:11
henry 发自 凹非寺 量子位 | 公众号 ChatGPT三岁生日这一天,硅谷热议的新模型来自 DeepSeek 。 准确说是 两款开源 模型—— DeepSeek-V3.2 和 DeepSeek-V3.2-Speciale 。 这俩模型火到什么程度呢? 有网友表示,在去圣地亚哥的(疑似赶场NeurIPS 2025)航班上,有30%的乘客都在对着DeepSeek的PDF两眼冒光。 其中,标准版DeepSeek-V3.2在推理测试中,达到了GPT-5的水平,仅略低于Gemini-3.0-Pro。 而"特别版"DeepSeek-V3.2-Speciale不仅全方位超越了GPT-5,还能在主流推理任务中和Gemini-3.0-Pro掰掰手腕。 此外,V3.2-Special还拿下了IMO、CMO、ICPC及IOI的金牌,并在ICPC和IOI上达到了人类选手第二名与第十名的水平。 而上周嘲讽DeepSeek "昙花一现"的推特更是在发布的当晚被刷到了 500万 浏览。 除了普通网友,奥特曼也是急急急急:不仅启动红色警报,还临时推迟了在ChatGPT上投放广告的计划。 与此同时,那一头的谷歌也没被放过。 网友直接 " ...