DeepSeek

Search documents
刚刚!英伟达H20芯片解禁!
国芯网· 2025-07-15 13:57
国芯网[原:中国半导体论坛] 振兴国产半导体产业! 不拘中国、 放眼世界 ! 关注 世界半导体论坛 ↓ ↓ ↓ 7月15日消息,据报道,英伟达黄仁勋宣布 :美国已批准H20芯片销往中国! 黄仁勋表示:"美国政府已经批准了我们的出口许可,我们可以开始发货了,所以我们将开始向中国市 场销售H20。我非常期待能很快发货H20,对此我感到非常高兴,这真是个非常、非常好的消息。第二 个消息是,我们还将发布一款名为RTX Pro的新显卡。这款显卡非常重要,因为它是专为计算机图形、 数字孪生和人工智能设计的。" H20芯片是英伟达为满足美国此前出口管制,而在2023年底推出专供中国市场的减配AI加速器。其基于 Hopper架构,算力仅为旗舰产品H100的六分之一。 时至今年年初,H20伴随国内AI算法公司DeepSeek横空出世而大放异彩。DeepSeek通过算法改进大幅降 低训练和推理成本,而业内此时也关注到,H20通信带宽速率及显存容量甚至优于A100,同时其价格较 低,高带宽与集群部署能力让这款算力芯片成为最适配DeepSeek本地部署的硬件方案。 以国内某服务器厂商的企业级方案,其仅用1台FusionServer ...
宝马合作Momenta,驾控之王要如何做智能辅助驾驶?
36氪· 2025-07-15 10:14
智能技术库装满之后, 宝马会如何发挥出最大威力? 智能辅助驾驶,对于不同汽车品牌,意义大为不同。 对于宝马,融入智能科技,则是其驾控基因的革新和蜕变。 就在7月15日,宝马宣布与中国自动驾驶技术头部公司Momenta达成合作,双方将基于国产宝马新世代车型的智能架构和硬件平台,开发基于AI大模型的 驾驶辅助功能软件。 宝马和Momenta合作开发的这套本土驾驶辅助系统将提供全场景、点到点的领航驾驶辅助功能,覆盖高速及城区道路。 "未来,宝马车主可实现从车位泊出,途经城区、高速、城区,到目的地车位泊入的跨城交通,一站式实现无忧出行。"双方在合作中表示。 智能辅助驾驶无疑是近几年,中国汽车领域角逐最为激烈的AI技术之一。它以年为单位实现技术栈的进化,以月为单位,进行版本更新,以10亿级为单 位,进行资金投入。 据介绍,合作将聚焦中国出行场景和用户需求,打造土生土长的中国专属智能驾驶辅助解决方案。该方案将应用于包含国产新世代在内的多款车型,覆盖 多个细分市场。 对于这样激烈的驾驶革命,视驾控为基因的宝马,早已未雨绸缪。 其在过去一年,已经围绕座舱,与华为、阿里、Deepseek展开了合作,而今天针对中国新世代车型的智 ...
梁文锋发愁
投资界· 2025-07-15 07:55
以下文章来源于中国企业家杂志 ,作者闫俊文 梁 文 锋 志 在 AGI ( 通 用 人 工 智 能 ) , 被 外 界 认 为 是 一 位 拥 有 纯 粹 技 术 理 想 的 人 才 。 在 2 0 24年7月的一次专访中,他提到,"当前阶段是技术创新期,而不是应用爆发期。从长 远来看,我们希望建立一个生态系统,让行业直接使用我们的技术和成果。" 目 前 , 2 0 2 5 年 已 逾 半 载 , 启 明 创 投 主 管 合 伙 人 周 志 峰 在 接 受 《 中 国 企 业 家 》 采 访 时 称," 202 5年也许就是从技术加速期到应用加速期的转换点,应用全面落地的雷声已经 隐隐可闻。" De e pSe e k是中国版的"Op e nAI ",既拥有最强的底层模型,又是拥有C端用户数量最多 的AI产品,但现在,在大模型方面,它面临着阿里巴巴、腾讯等科技公司的追赶,流量 遭遇挑战,在AI应用方面还没有更深的公开布局。 中国企业家杂志 . 讲好企业家故事,弘扬企业家精神 De e pSe e k流量下滑。 作者 | 闫俊文 来源 | 中国企业家杂志 (ID: iceo-com-cn) 7月3日,国外一家名 ...
“美国已经基本退出,都是中国的”
Guan Cha Zhe Wang· 2025-07-15 04:08
Core Viewpoint - Meta is considering a significant shift in its AI strategy by potentially moving from open-source AI models to closed-source models, which could mark a departure from its long-standing commitment to open-source development [1][5][6] Group 1: Strategic Shift - Meta's newly established "Super Intelligence Lab" (MSL) is contemplating abandoning its powerful open-source AI model, Behemoth, in favor of developing a closed-source model [1][5] - This potential shift is seen as a major strategic change for Meta, which has historically believed that open-source technology fosters faster AI development and broader access for developers [5][6] - The decision is reportedly influenced by the underperformance of the Behemoth model during internal testing, leading to delays in its release [5][6] Group 2: Leadership and Talent Acquisition - Meta has appointed Alexandr Wang, the new AI head, who previously led Scale AI, to oversee the Super Intelligence Lab, which consists of a specialized team of about 12 members [6][7] - The company has adopted a "high-paying talent acquisition" strategy, offering salaries exceeding $100 million to attract top researchers from competitors like OpenAI, Google, and Apple [5][6] Group 3: Market Implications - The shift towards closed-source models could signify a retreat from the competitive landscape of open-source large language models (LLMs), with concerns raised about the U.S. losing its edge in this area [1][3] - The ongoing developments in Meta's AI strategy are closely watched, especially as the company faces challenges in the AI technology sector [5][6]
DeepSeek使用率暴跌至3%,新模型未推出或成主因
Xi Niu Cai Jing· 2025-07-15 02:09
同时,英伟达 H20 芯片的短缺也是影响 DeepSeek 新模型发布以及现有模型部署的重要因素。据 The Information 报道,DeepSeek 团队一直在密集推进 R2 模 型开发,但 CEO 梁文锋目前对模型的能力仍不满意,内部仍在继续提升性能,相应模型尚未准备好正式投用。 值得注意的是,在此期间,DeepSeek 的竞争对手们却在不断推陈出新。如 ChatGPT 和谷歌 Gemini 等海外竞争对手,同期官网流量分别增长 40.6% 和 85.8%。 不过,也有人对 Semianalysis 和 Poe 数据的局限性提出了质疑。Semianalysis 的图表说明文字,表示由于中国市场数据监测存在局限性,当前统计未能完全 体现其实际覆盖规模。而 Poe 所示的所有使用数据均基于其订阅者,且核心统计对象是 DeepSeek 官网,不包括腾讯元宝、百度、夸克等深度接入 DeepSeek 的第三方渠道。 据了解,DeepSeek 使用率暴跌的主要原因是新模型 R2 迟迟未推出。其原本计划于 5 月推出的 DeepSeek-R2,至今仍未上线,发布时间多次推迟,这使得用 户对 DeepSeek 的关 ...
Kimi K2 is INSANE... (Open-Source is BACK!)
Matthew Berman· 2025-07-14 17:43
This might be the next deepseek moment. A Chinese company just released another open-source model called Kimmy K2 and it is taking the industry by storm. The reason this graph right here, this is the training loss curve, and people are so surprised by how smooth it is.Typically, you get all of these spikes in here which cause issues that you need to correct. But for Kimmy, it was almost flawless. And the especially cool thing, it is based on a trillion tokens.That is a massive model. So they came up with th ...
Nvidia's Jensen Huang: China Doesn't Need US Chips
Benzinga· 2025-07-14 16:15
Nvidia Corp. NVDA CEO Jensen Huang said that the Chinese military is not using his company's chips due to export controls and tensions between the U.S. and China. The Details: Speaking in a CNN interview on Sunday, Huang argued that China cannot depend on U.S.-made technology for its military needs because access to such technology could be restricted at any time. "It could be limited at any time; not to mention, there's plenty of computing capacity in China already," Huang said. "They don't need Nvidia's c ...
21评论|Manus迁徙,大模型走到生死时刻
2 1 Shi Ji Jing Ji Bao Dao· 2025-07-14 11:05
几乎同时,有消息传出,AI大模型"六小虎"之一的百川智能,其联合创始人谢剑即将离职。公司核心高 管只剩下王小川在勉力支撑他的医疗AI梦。 斯坦福大学今年4月初发布的《2025年人工智能指数报告》显示,到2025年2月,头部模型性能差距已从 去年初的9.26%缩小至1.70%。 随着技术壁垒的减弱,大模型竞争呈现两个鲜明特征:一是成本急剧降低。以GPT-3.5水平为基准,调 用成本从2022年20美元/百万token跌至2024年0.07美元/百万token,18个月骤降99.65%。其中最具代表性 的当然是DeepSeek的崛起,在全球AI界掀起了工程优化和成本效率革命的浪潮至今未息。 二是资本、资源消耗战。虽然DeepSeek走出了一条从架构到性能优化的路径,但大模型的进阶,本质 上仍然离不开资金、芯片的持续消耗。 21世纪经济报道记者孔海丽 北京报道 "百模"大战后,最艰难的考验已经到来。 当Manus清空微博和小红书账号、官网挂出"地区不可用"的提示时,这个曾因邀请码炒至10万元而刷屏 的AI明星,已悄然将总部迁至新加坡。 二是垂直深潜战略。医疗是公认的最适合人工智能垂直应用的领域之一。百川智能就聚焦于 ...
当Meta开始重新定义AI军备竞赛:一个巨头的失败、觉醒与产业震荡 | Jinqiu Select
锦秋集· 2025-07-14 08:23
Meta正在改写AI产业的游戏规则。Llama 4的失利后,扎克伯格亲自挂帅,启动了一场前所未有的资源战:4年2亿美元成为挖人的"标配",300亿美元拿 下Scale AI近半股份,在"帐篷"里搭建千亿美元规模的GPU集群…… 当一家拥有千亿现金流的巨头开始"不计成本",整个行业的竞争门槛和资源分配逻辑都在被重新定义。 巨头的每一个战略转向都会在产业链上引发连锁反应——人才成本的飙升、基础设施门槛的提高、竞争维度的改变,这些变化最终会传导到每一个市 场参与者身上。 因此,我们认为巨头在失败后的战略调整及其对产业生态的深远影响,是所有AI领域参与者都需要关注和思考的。 semianlysis最近的一篇文章深入剖析了这家社交巨头从失败到激进转型背后的真实逻辑。 本文首先分析了Meta在Llama 4项目上失败的三个关键原因: 技术决策上,他们在训练中途临时更换核心架构(从专家选择路由切换到令牌选择路由),犯下了"边开飞机边换引擎"的致命错误; 评估体系上,缺乏基础的测试框架,导致分块注意力机制的严重缺陷直到后期才暴露; 组织管理上,多个研究方向各自为战,缺乏统一指挥,陷入了典型的"资源诅咒"——钱多反而导致方向失 ...
Kimi K2发布两天即“封神”?80%成本优势追平Claude 4、打趴“全球最强AI”,架构与DeepSeek相似!
AI前线· 2025-07-14 07:42
整理 | 华卫 近日,国内大模型独角兽月之暗面发布并开源的最新一代 MoE 架构基础模型 Kimi K2,不断在海外 掀起热议。有最新数据显示,推出不到两天,该模型在大模型 API 聚合平台 OpenRouter 的 token 使用量就超越了马斯克创立的 xAI。前不久,xAI 刚发布号称"全球最强 AI"的 Grok 4。 据官方介绍,作为月之暗面首款开源发布的旗舰模型,Kimi K2 的总参数量达到 1 万亿(1T),激 活参数为 32B,现已在 Kimi Web 端和 App 端中上线。有网友感叹道,"万亿参数级模型已开始能在 非英伟达硬件上流畅运行……如果中国实验室能通过巧妙的路由策略,在更少的芯片上实现更强的智 能,那么英伟达对 AI 硬件体系的垄断地位就会开始动摇。这是典型的 '压力下的创新':拿不到高端 芯片?没关系,我们重新设计一切,让自研硬件能发挥出更优性能。" 在代码、Agent、工具调用这三方面的相关基准测试中,该模型均取得开源模型中的 SOTA 成绩。除 了基准性能测试,Kimi K2 在多个实际场景中也展现出更强的能力泛化和实用性,包括在前端开发任 务中生成兼具设计感与视觉表现力的 ...