Workflow
DeepSeek
icon
Search documents
闭源越跑越快之后,DeepSeek V3.2 如何为开源模型杀出一条新路
深思SenseAI· 2025-12-03 09:51
过去一年多里, 大多数权威评测仍然在反复强调同一件事:在最前沿的综合能力上,闭源模型的曲线更陡,开源想在所有维度上追平变得越来越难。 DeepSeek 在技术报告中也承认:开源社区在进步,但 Anthropic 、 Gemini 、 OpenAI 这些闭源模型的性能曲线更陡,差距其实在拉大。在复杂任务上,闭源 系统展现出越来越明显 的优势。 目前开源模型有三个关键问题 : 1. 首先,在架构层面,当前主流仍高度依赖 Vanilla Attention 机制,这在 长序列场景 下会严重限制计算效率。这种低效对模型的 大规模部署 以及有效的后训 练都构成了实质性障碍。 2. 其次,在资源投入上,开源模型在 后训练 阶段普遍面临 算力投入不足 的问题,从而限制了其在高难度任务上的表现。 3. 最后,在 AI Agent 场景中,相比于闭源系统,开源模型在 泛化能力 与 指令跟随能力 方面存在显著滞后,这削弱了其在真实部署中的有效性。 12月1 号, DeepSeek 发布了两款新模型: DeepSeek V3.2 和 DeepSeek V3.2 Speciale ,针对这三个问题, 提出了三个改进 : 1. 引入了 ...
DeepSeek V3.2发布!实测效果惊艳,便宜是最大优势
3 6 Ke· 2025-12-03 03:57
小雷发现,DeepSeek似乎真的很喜欢大晚上给大家突然来个惊喜。 12月1日晚,DeepSeek突然来了一波更新:V3.2版本正式上线并向所有用户开放,同时也在各个开源社区上传了V3.2的本地部署模型供所有用户使用。从官 方公布的测试结果来看,DeepSeek V3.2的推理能力已经基本与OpenAI的GPT-5相近,但是其成本却远低于GPT-5,可以说仅这一点就足以让不少人为之兴 奋了。 好了,废话不多说,让我们直接进入正题,看看DeepSeek这次给我们带来了哪些方面的提升。 推理更强还更便宜 DeepSeek V3.2共有两个版本,一个是在DeepSeek官方网站上给大家免费使用的DeepSeek V3.2版,另一个则是仅支持API服务访问的DeepSeek V3.2- Speciale,从官方的描述来看,Speciale版拥有更强的推理能力,其主要用于探索目前模型能力的推理能力上限。 V3.2-Speciale除了会主动进入"长思考加强"模式外,还结合了DeepSeek-Math-V2的定理证明能力,使其拥有更强的指令跟随、数学证明和逻辑验证能力。在 官方测试中,V3.2-Speciale的推理基准 ...
DeepSeek杀出一条血路:国产大模型突围不靠运气
3 6 Ke· 2025-12-03 03:21
进入2025年末,全球大模型赛道的技术焦点几乎被Google重新夺回。Gemini 3 Pro横空出世,在多个权 威基准上超越所有开源模型,重新确立了闭源阵营的技术高地。一时间,业内关于"开源模型是否已到 极限""Scaling Law是否真的撞墙"的质疑声再起,一股迟滞情绪在开源社区弥漫。 但就在此时,DeepSeek没有选择沉默。12月1日,它一口气发布了两款重磅模型:推理性能对标GPT-5 的DeepSeek-V3.2,以及在数学、逻辑和多轮工具调用中表现异常强势的Speciale版本。这不仅是对技术 能力的集中展示,也是在当前算力资源并不占优的前提下,对闭源"新天花板"的正面回应。 这不是一次简单的模型更新。DeepSeek试图在后Scaling时代找出一条全新路径:如何用架构重塑弥补 预训练差距?如何通过"工具使用中的思考链"实现低token高效率的智能体表现?更关键的是,Agent为 何从附属功能变成了模型能力跃迁的核心引擎? 本文将围绕这三条主线展开分析:DeepSeek是如何在技术瓶颈下突破的?为何率先在开源阵营中重注 Agent?而这是否意味着,开源模型仍有穿透闭源护城河的那条路? 这背后的 ...
DeepSeek发布新模型!创业板50ETF(159949)涨0.48%,机构持续看好AI产业链投资机会
Xin Lang Cai Jing· 2025-12-03 02:33
炒股就看金麒麟分析师研报,权威,专业,及时,全面,助您挖掘潜力主题机会! 12月3日消息,指数早盘宽幅震荡,创指盘中涨逾1%。截至10:20,创业板50ETF(159949)上涨 0.48%,报1.467元,换手率1.66%,成交额4.22亿元。 | | 1.467 +0.007 +0.48% | | | 创业板50ETF | 家 | | --- | --- | --- | --- | --- | --- | | | | | | | 159949 | | SZSE CNY 10:20:39 交易中 | | | | | 通 股 / ● + | | 净值走势 | | 华安创业板50ETF | 交生 | 52.65% 120日 | 63.36% | | 愛比 | 23.71% 委差 | 186453 | 5日 | 1.38% 250日 | 50.62% | | 死 | 1.472 | 18614 | 20日 | -2.52% 52周高 | 1.60 | | 英四 | 1.471 | 14208 | 60日 | 9.81% 52周低 | 0.76 | | ਹੈ। | 1.470 | 82790 | 实时申购廈回信息 ...
DeepSeek的小更新,暴打了OpenAI,追上了Gemini
3 6 Ke· 2025-12-03 00:58
坏消息,开源模型和闭源模型的差距越来越大了。 好消息,DeepSeek 又出手了。 12 月 1 日,DeepSeek 发布了两款新模型 —— DeepSeek V3.2 和 DeepSeek-V3.2-Speciale。 | 快速开始 | | --- | | 首次调用 API | | 模型 & 价格 | | Temperature 设置 | | Token 用量计算 | | 限速 | | 错误码 | | 新闻 | | DeepSeek-V3.2 正式版发布 | | 2025/12/01 | | DeepSeek-V3.2-Exp 发布 | | 2025/09/29 | | DeepSeek V3.1 更新 2025/0 | | DeepSeek V3.1 发布 2025/0 | | DeepSeek-R1-0528 发布 | | 2025/05/28 | | DeepSeek-V3-0324 发布 | | 2025/03/25 | 前者和 GPT-5 能打的有来有回,后面的高性能版更是直接把 GPT 爆了,开始和闭源模型天花板 —— Gemini 打了个五五开。 还在IMO 2025(国际数学奥林匹克)、C ...
DeepSeekV3.2技术报告还是老外看得细
量子位· 2025-12-03 00:11
henry 发自 凹非寺 量子位 | 公众号 ChatGPT三岁生日这一天,硅谷热议的新模型来自 DeepSeek 。 准确说是 两款开源 模型—— DeepSeek-V3.2 和 DeepSeek-V3.2-Speciale 。 这俩模型火到什么程度呢? 有网友表示,在去圣地亚哥的(疑似赶场NeurIPS 2025)航班上,有30%的乘客都在对着DeepSeek的PDF两眼冒光。 其中,标准版DeepSeek-V3.2在推理测试中,达到了GPT-5的水平,仅略低于Gemini-3.0-Pro。 而"特别版"DeepSeek-V3.2-Speciale不仅全方位超越了GPT-5,还能在主流推理任务中和Gemini-3.0-Pro掰掰手腕。 此外,V3.2-Special还拿下了IMO、CMO、ICPC及IOI的金牌,并在ICPC和IOI上达到了人类选手第二名与第十名的水平。 而上周嘲讽DeepSeek "昙花一现"的推特更是在发布的当晚被刷到了 500万 浏览。 除了普通网友,奥特曼也是急急急急:不仅启动红色警报,还临时推迟了在ChatGPT上投放广告的计划。 与此同时,那一头的谷歌也没被放过。 网友直接 " ...
OpenAI首席研究员Mark Chen长访谈:小扎亲手端汤来公司挖人,气得我们端着汤去了Meta
量子位· 2025-12-03 00:11
西风 发自 凹非寺 量子位 | 公众号 QbitAI 救大命, OpenAI首席研究官Mark Chen最新访谈 ,信息量有点大呀。 不管是OpenAI的,还是自己个儿的,又或者是同事的,主打一个" 我都能聊聊 "。 比如: 网友纷纷表示,这次访谈确实让人耳目一新,还有不少人在转发Mark Chen的观点。 Mark Chen之所以能够言无不尽,一大关键还在于,本期访谈来自于《Core Memory》,其主持人 A shlee Vanc e 是硅谷知名的科技记 者,以深入采访硅谷人物和讲述科技创新故事而闻名,更知名的是他那本 《硅谷钢铁侠:埃隆·马斯克,创造未来的人》 。 量子位对完整访谈进行了翻译整理,在不改变原意的前提下,对语言做了适当润色。 爆料Meta抢人大战私下已经升级成 送汤大战 了, 真能喝的那种汤, 小扎熬了亲自送到OpenAI研究员嘴边。OpenAI反击也送汤。 Mark Chen、Scott Gray(OpenAI专门负责GPU内核优化的神秘狠人)等经常三五围坐, 打扑克牌。其本质被解释为是概率与期望值的博 弈。 OpenAI核心研究团队规模大概500人,公司内大概有300个项目。 Mar ...
OpenAI’s ‘code red’ memo lays bare pressure from Google, DeepSeek and its $1.4 trillion AI bet
CNBC Television· 2025-12-02 18:31
Uh McKenzie Seagalos joins us now. What does this what does this mean. I mean, is this now uh put put Google in a in a position now where they have um a a uh an opportunity now to to to beat uh Open AI in any stretch.>> It certainly seems to signal that. So this code red warning comes from a leaked memo cited by the journal and the information and in it Sam Alman tells staff to pause work on ads health and shopping agents and then shift focus back to their core chat GBT experience faster responses better pe ...
OpenAI's ‘code red' memo lays bare pressure from Google, DeepSeek and its $1.4 trillion AI bet
Youtube· 2025-12-02 18:31
Uh McKenzie Seagalos joins us now. What does this what does this mean. I mean, is this now uh put put Google in a in a position now where they have um a a uh an opportunity now to to to beat uh Open AI in any stretch.>> It certainly seems to signal that. So this code red warning comes from a leaked memo cited by the journal and the information and in it Sam Alman tells staff to pause work on ads health and shopping agents and then shift focus back to their core chat GBT experience faster responses better pe ...
好家伙!DeepSeek 一口气连发 2 个新模型
程序员的那些事· 2025-12-02 13:49
转自:量子位 | 公众号 QbitAI 突袭! ChatGPT发布三周年,DeepSeek嚯一下发出两个模型: 前者聚焦平衡实用 ,适用于日常问答、通用Agent任务、真实应用场景下的工具调用。 推理达GPT-5水平,略低于Gemini-3.0-Pro。 后者主打极致推理, 推理基准性能媲美Gemini-3.0-Pro。 还一把斩获IMO 2025、CMO 2025、ICPC World Finals 2025、IOI 2025金牌。 划重点,ICPC达到人类选手第二、IOI人类选手第十名水平。 具体来说,DeepSeek-V3.2侧重于平衡推理能力与输出长度,降低计算开销。 DeepSeek官微推文中写道,"DeepSeek-V3.2模型在Agent评测中达到了当前开源模型的最高水平"。 该模型其他情况如下: 下图展示的是DeepSeek-V3.2与其他模型在各类Agent工具调用评测集上的得分 DeepSeek-V3.2 DeepSeek-V3.2-Speciale 推理能力比肩GPT-5; 相比Kimi-K2-Thinking大幅缩短输出长度,减少用户等待时间; DeepSeek旗下首个"思考融入工具调 ...