Seek .(SKLTY)
Search documents
AI三国杀:OpenAI狂卷,DeepSeek封神,却被Mistral偷了家?
3 6 Ke· 2025-12-03 11:55
就在昨天,「欧洲版DeepSeek」一口气公布了两件事: 一个MoE大模型:Mistral Large 3 一套小模型:Ministral 3(14B/8B/3B) 全部开源、全部多模态、全部能落地。 Mistral Large 3 这次Mistral推出的Mistral Large 3,规格上看几乎是「开源界的准天花板」: 41B active / 675B total的MoE架构、原生图像理解、256k context、多语言能力在非英中语种上强得离谱,LMArena排名直接杀到开源模型第6。 Mistral Large 3的ELO得分在开源大模型中稳居第一梯队,和Kimi K2打成平手,仅落后DeepSeek v3.2一小截 它的底模表现也不弱,在多个基础任务上与DeepSeek、Kimi这种体量更大的模型正面交手。 Mistral Large 3(Base)在MMLU、GPOA、SimpleQA、AMC、LiveCodeBench等多项基础任务上与DeepSeek 37B、Kimi K2 127B保持同一水平,属于开源 系的第一梯队底模 再看预训练能力,它和Qwen、Gemma的底模在核心评测上也是正 ...
朱啸虎:DeepSeek对人类历史的改变被低估了 |未竟之约
Xin Lang Cai Jing· 2025-12-03 10:40
新浪声明:所有会议实录均为现场速记整理,未经演讲者审阅,新浪网登载此文出于传递更多信息之目 的,并不意味着赞同其观点或证实其描述。 责任编辑:梁斌 SF055 由新浪财经 、微博着力打造,微博财经 × 语言即世界工作室联合出品的泛财经人文对话栏目《未竟之 约》首期深度访谈即将上线。主持人张小珺对话金沙江创投主管合伙人朱啸虎,直面AI浪潮下的激流 与暗礁。 朱啸虎:DeepSeek对人类历史的改变被低估了。 由新浪财经 、微博着力打造,微博财经 × 语言即世界工作室联合出品的泛财经人文对话栏目《未竟之 约》首期深度访谈即将上线。主持人张小珺对话金沙江创投主管合伙人朱啸虎,直面AI浪潮下的激流 与暗礁。 朱啸虎:DeepSeek对人类历史的改变被低估了。 新浪声明:所有会议实录均为现场速记整理,未经演讲者审阅,新浪网登载此文出于传递更多信息之目 的,并不意味着赞同其观点或证实其描述。 责任编辑:梁斌 SF055 ...
老外傻眼,明用英文提问,DeepSeek依然坚持中文思考
3 6 Ke· 2025-12-03 09:14
就在前天,DeepSeek 一口气上新了两个新模型,DeepSeek-V3.2 和 DeepSeek-V3.2-Speciale。 这两大版本在推理能力上有了显著的提升,DeepSeek-V3.2 版本能和 GPT-5 硬碰硬,而 Speciale 结合长思考和定理证明能力,表现媲美 Gemini-3.0-Pro。 有读者评论说:「这个模型不应该叫 V3.2,应该叫 V4。」 海外研究者也迫不及待的用上了 DeepSeek 的新版本,在感慨 DeepSeek 推理速度显著提升之余,却又碰上了他们难以理解的事情: 哪怕在用英文询问 DeepSeek 的时候,它在思考过程中还是会切回「神秘的东方文字」。 这就把海外友人整蒙了:明明没有用中文提问,为什么模型还是会使用中文思考,难道用中文推理更好更快? 评论区有两种不同的观点,但大部分评论都认为:「汉字的信息密度更高」。 来自亚马逊的研究者也这么认为: 这个结论很符合我们日常的认知,表达相同的文本含义,中文所需的字符量是明显更少的。如果大模型理解与语义压缩相关的话,那么中文相比于广泛使 用的英文在压缩方面更有效率。或许这也是「中文更省 token」说法的来源。 具有 ...
DeepSeek V3.2正式版发布:官方称推理比肩GPT-5
Feng Huang Wang· 2025-12-03 09:04
12月1日,深度求索(DeepSeek)正式发布新一代开源大模型DeepSeek-V3.2及其长思考增强版DeepSeek-V3.2-Speciale。官方网页端、App及API已同步更新 至V3.2版本。 根据官方数据,在公开的推理基准测试中,DeepSeek-V3.2的推理能力达到GPT-5水平,与Gemini-3.0-Pro接近,同时输出长度较Kimi-K2-Thinking显著缩短, 以降低计算开销。V3.2-Speciale版本融合了DeepSeek-Math-V2的定理证明能力,在IMO、CMO、ICPC及IOI等多项国际竞赛中取得金牌成绩,其中ICPC成绩 达到人类选手第二名水平。 新版本首次实现了思考模式与工具调用的融合,支持在思考过程中调用外部工具。通过大规模Agent训练数据合成方法,模型在1800多个环境和超过8.5万条 复杂指令上进行了强化学习训练,提升了泛化能力。官方称其在智能体评测中达到当前开源模型最高水平,进一步缩小了与闭源模型的差距。 此前的实验版本DeepSeek-V3.2-Exp于两个月前发布,经用户反馈测试,其采用的DSA稀疏注意力机制在各项场景中未出现显著性能下降。Sp ...
聊DeepSeek、聊AI硬件、聊竞争对手,OpenAI首席研究官专访信息密度有点大
3 6 Ke· 2025-12-03 07:46
OpenAI首席研究官马克·陈(Mark Chen)近日接受资深科技记者Ashlee Vance专访,描绘了这家全球领 先AI实验室的最新战略图景。 在当前AI竞争白热化、技术迭代加速的关键节点,Mark Chen不仅回应了外界对公司技术方向和人才流 失的担忧,更明确了OpenAI追求AGI的独特哲学和短期路线图。 扎克伯格"送汤"挖人,顶尖AI专家却依然选择留下 他强调,OpenAI与许多实验室的关键区别在于,始终将探索性研究置于首位。"我们不做跟随性研究, 不单纯追逐基准测试分数,"他指出。OpenAI将大量计算资源投入探索"下一个范式",这部分投入甚至 经常超过最终模型训练本身的消耗。 在管理过程中,最具挑战性的部分往往是拒绝。但马克·陈认为,优秀的领导力体现在能够清晰地 说"不"并解释原因。"我们必须不断强调:这些是当前的优先事项,这些是我们期望看到的成果类 型。"他解释道。 公司允许次要项目的存在,但它们必须被明确界定为从属地位。这种透明且坚定的原则,被马克·陈视 为保持研究组织高效运作的关键。通过这套严格的评估与资源分配机制,OpenAI力求将其宝贵的算力 集中于探索技术前沿的"范式突破",而非进 ...
DeepSeek V3.2发布!实测效果惊艳,便宜是最大优势
3 6 Ke· 2025-12-03 03:57
小雷发现,DeepSeek似乎真的很喜欢大晚上给大家突然来个惊喜。 12月1日晚,DeepSeek突然来了一波更新:V3.2版本正式上线并向所有用户开放,同时也在各个开源社区上传了V3.2的本地部署模型供所有用户使用。从官 方公布的测试结果来看,DeepSeek V3.2的推理能力已经基本与OpenAI的GPT-5相近,但是其成本却远低于GPT-5,可以说仅这一点就足以让不少人为之兴 奋了。 好了,废话不多说,让我们直接进入正题,看看DeepSeek这次给我们带来了哪些方面的提升。 推理更强还更便宜 DeepSeek V3.2共有两个版本,一个是在DeepSeek官方网站上给大家免费使用的DeepSeek V3.2版,另一个则是仅支持API服务访问的DeepSeek V3.2- Speciale,从官方的描述来看,Speciale版拥有更强的推理能力,其主要用于探索目前模型能力的推理能力上限。 V3.2-Speciale除了会主动进入"长思考加强"模式外,还结合了DeepSeek-Math-V2的定理证明能力,使其拥有更强的指令跟随、数学证明和逻辑验证能力。在 官方测试中,V3.2-Speciale的推理基准 ...
如果你非得用DeepSeek看病,建议这么看(附详细提问模版)
3 6 Ke· 2025-12-03 03:23
你用DeepSeek看过病了吗? 打开它,说出自己的不舒服或拍照上传检查结果,几秒后就能得到诊断和治疗建议。继续问这个病是怎么回事或药怎么用,它还能给出更详细易懂的解 释,有问必答。 不花钱、不用抢号,还比医生耐心得多,是不是以后看病找DeepSeek就行?如果问DeepSeek本人,它会回答: DeepSeek对自己可不可以看病的回答 | DeepSeek截图 实际让DeepSeek看一次病,你会在回复的末尾见到一个提示框: 3. 开出另外几项检查,分辨表现相近的疾病、确定诊断; 问其他问题的时候,一般不会出现这个提示框 | DeepSeek截图 "不能""不应""仅供参考",这是DeepSeek太过谦虚,还是看病这件事有什么特殊的地方? 下面,我们来看看到底能不能用DeepSeek看病,和怎么用它把病看得更好(附详细提问模板)。 能不能用AI看病?当专家不能,当助手很能 有一种用DeepSeek等人工智能助手(AI)看病的方法是,得到它的回复之后就给自己确诊,然后听从AI建议开始吃药,就像刚刚找医学专家看过病。 可是,医学专家看病时很少单凭几句描述或者一张检查单,就给出一个确定的诊断,接来下可能还会做这些 ...
DeepSeek杀出一条血路:国产大模型突围不靠运气
3 6 Ke· 2025-12-03 03:21
进入2025年末,全球大模型赛道的技术焦点几乎被Google重新夺回。Gemini 3 Pro横空出世,在多个权 威基准上超越所有开源模型,重新确立了闭源阵营的技术高地。一时间,业内关于"开源模型是否已到 极限""Scaling Law是否真的撞墙"的质疑声再起,一股迟滞情绪在开源社区弥漫。 但就在此时,DeepSeek没有选择沉默。12月1日,它一口气发布了两款重磅模型:推理性能对标GPT-5 的DeepSeek-V3.2,以及在数学、逻辑和多轮工具调用中表现异常强势的Speciale版本。这不仅是对技术 能力的集中展示,也是在当前算力资源并不占优的前提下,对闭源"新天花板"的正面回应。 这不是一次简单的模型更新。DeepSeek试图在后Scaling时代找出一条全新路径:如何用架构重塑弥补 预训练差距?如何通过"工具使用中的思考链"实现低token高效率的智能体表现?更关键的是,Agent为 何从附属功能变成了模型能力跃迁的核心引擎? 本文将围绕这三条主线展开分析:DeepSeek是如何在技术瓶颈下突破的?为何率先在开源阵营中重注 Agent?而这是否意味着,开源模型仍有穿透闭源护城河的那条路? 这背后的 ...
DeepSeek发布新模型!创业板50ETF(159949)涨0.48%,机构持续看好AI产业链投资机会
Xin Lang Cai Jing· 2025-12-03 02:33
炒股就看金麒麟分析师研报,权威,专业,及时,全面,助您挖掘潜力主题机会! 12月3日消息,指数早盘宽幅震荡,创指盘中涨逾1%。截至10:20,创业板50ETF(159949)上涨 0.48%,报1.467元,换手率1.66%,成交额4.22亿元。 | | 1.467 +0.007 +0.48% | | | 创业板50ETF | 家 | | --- | --- | --- | --- | --- | --- | | | | | | | 159949 | | SZSE CNY 10:20:39 交易中 | | | | | 通 股 / ● + | | 净值走势 | | 华安创业板50ETF | 交生 | 52.65% 120日 | 63.36% | | 愛比 | 23.71% 委差 | 186453 | 5日 | 1.38% 250日 | 50.62% | | 死 | 1.472 | 18614 | 20日 | -2.52% 52周高 | 1.60 | | 英四 | 1.471 | 14208 | 60日 | 9.81% 52周低 | 0.76 | | ਹੈ। | 1.470 | 82790 | 实时申购廈回信息 ...
AI产业速递:从DeepSeek V3
2025-12-03 02:12
AI 产业速递:从 DeepSeek V3.2 看强化学习的新变化 20251202 摘要 Deepseek V3.2 通过 DSA 机制优化推理效率,减少冗余计算,尤其在 复杂任务中表现突出,取代了之前的 MLA 机制。 Deepseek V3.2 的 C9 版本在后训练阶段通过投入 10%的预训练计算 量,显著提升了模型在复杂任务(如代码调试)中的强化学习能力,达 到全球领先水平。 V3.2 采用高效的上下文管理策略,智能处理用户频繁开启新任务、多轮 对话及模糊输入,有效降低推理成本。 V3.2 使用大量人类专家编写并增量训练生成的高难度合成数据,比例较 之前增加一倍以上,对后续强化学习阶段至关重要,并消耗了大量算力。 Deepseek 在后训练阶段的创新,包括开源后训练结果和支持 Agent 调 用能力,使得开源模型在功能上可与闭源模型媲美,可能引领开源项目 的新趋势。 DeepMind 的新框架结合 Rubik's 规则提示机制,提高了强化学习效率, 促使大型科技公司加速探索多模态视频和图像领域的应用,推动 2025 年相关模型的发展。 稀疏化技术降低了训练算力要求,并提升了训练上限,预计到 2026 ...