CloudMatrix 384超节点

Search documents
华为芯片,让英伟达黄教主坐不住了
21世纪经济报道· 2025-07-07 08:56
作 者丨倪雨晴 编 辑丨骆一帆 视频编辑丨柳润瑛 设 计丨黎旭廷 华为的昇腾,让英伟达黄教主都坐不住了。他公开表示,华为昇腾CloudMatrix 384超节点, 部分性能上甚至超过英伟达的产品。 华为的384超节点方案,就像全真七子用剑阵打黄药师,集群一起上,黄药师还真有点招架不 住。 海外专业机构SemiAnalysis更是直接点名:384超节点的整体计算能力是英伟达GB200机柜的 1.6倍! 在单芯片性能受限、制裁持续的情况下,华为昇腾是真能打,还是"自嗨"?它是如何与英伟 达竞争的?国产算力究竟到了什么水平?还有什么差距? 今天,我们就带着这些问题,一口气了解对垒英伟达的国产芯片,昇腾。 和英伟达"掰手腕" 昇腾此前非常低调,它是华为打造的一款AI芯片。它不是拿来打游戏的显卡,也不是电脑中 的CPU,而是专门针对AI任务的加速芯片NPU,是一颗纯纯的"AI处理器"。 目前昇腾最主力的产品叫"昇腾910"。但以往的昇腾芯片,更多是作为"备胎"使用的——因为 美国断供,英伟达、AMD最高端的芯片买不到,很多厂商只能硬着头皮用国产,而昇腾已经 是国产芯片中的佼佼者。 过去几年,昇腾其实主要用在AI"推理" ...
华为芯片,究竟有多牛(下)
2 1 Shi Ji Jing Ji Bao Dao· 2025-07-07 03:18
0:00 21世纪经济报道记者倪雨晴 深圳报道 华为昇腾是怎么做到和英伟达"掰手腕"的? 技术拆解 要理解这个问题,我们得先来认识昇腾的最强战力,"CloudMatrix 384 超节点"这个大家伙。这就是它 的外观(画面:384的结构图),它其实就是一个巨大的芯片集合,这最核心的384张昇腾910芯片,外 加192颗鲲鹏CPU,通通塞进16个机柜,然后用光缆、光模块联接起来,构成一个"超节点"。 你可以把它想象成一支超级"AI方阵":虽然单个士兵不如对手,但整体配合、纪律、调度都非常出色。 最终打起仗来,不一定会输。 听起来是不是有点像"芯片大拼盘"?但是,要把384块芯片联接在一起,像一台机器一样高效工作、协 同配合,这可不简单。 你可能不知道,英伟达目前GB200的机柜,只塞了72块GPU,下一代是144块GPU, 这个"大力出奇迹"的背后,是通信、光学、热学、基础软件等多个领域的老底子,一起发力的结果。 核心突破点包括: 听上去有点技术?咱们展开说说一项很关键的互联技术。 在计算集群里,无论是 CPU、GPU 还是 NPU,最终都需要高效的联接起来,才能交换传输数据。 英伟达有独家的NVLink互联技 ...
华为芯片,究竟有多牛?(上)
2 1 Shi Ji Jing Ji Bao Dao· 2025-07-06 03:12
0:00 21世纪经济报道记者倪雨晴 深圳报道 华为的昇腾,让英伟达黄教主都坐不住了。他公开表示,华为昇腾CloudMatrix 384超节点,部分性能上 甚至超过英伟达的产品。 华为的384超节点方案,就像全真七子用剑阵打黄药师,集群一起上,黄药师还真有点招架不住。 海外专业机构SemiAnalysis更是直接点名:384超节点的整体计算能力是英伟达GB200机柜的1.6倍! 在单芯片性能受限、制裁持续的情况下,华为昇腾是真能打,还是"自嗨"?它是如何与英伟达竞争的? 国产算力究竟到了什么水平?还有什么差距? 今天,我们就带着这些问题,一口气了解对垒英伟达的国产芯片,昇腾。 和英伟达"掰手腕" 目前昇腾最主力的产品叫"昇腾910"。但以往的昇腾芯片,更多是作为"备胎"使用的——因为美国断 供,英伟达、AMD最高端的芯片买不到,很多厂商只能硬着头皮用国产,而昇腾已经是国产芯片中的 佼佼者。 过去几年,昇腾其实主要用在AI"推理"环节,也就是模型训练好之后,用它来支持大模型生成内容、聊 天等应用环节。但模型训练?说实话——很少用国产芯片,原因也简单:单卡性能弱、生态不够用、系 统稳定性差。 但这一切,在2024 ...
科创板迎硬核玩家:沐曦IPO获受理 ,国产GPU上市提速
2 1 Shi Ji Jing Ji Bao Dao· 2025-07-01 12:52
Core Viewpoint - The rise of domestic AI chip companies, particularly Muxi Integrated Circuit (Shanghai) Co., Ltd., is accelerating their entry into the capital market, with Muxi's IPO on the Sci-Tech Innovation Board being a significant event in the GPU sector [1][2]. Company Overview - Muxi aims to raise 3.904 billion yuan for the development and industrialization of next-generation general-purpose GPUs, AI inference chips, and advanced heterogeneous computing architectures [1]. - Founded in 2020, Muxi is part of the "Four Little Dragons" of domestic GPUs, alongside companies like Moore Threads and Birran Technology [2]. - Muxi's flagship product, the "Xiyun C series," is a self-developed GPU chip that has achieved significant sales and application in AI public computing platforms [3]. Financial Performance - Muxi's revenue projections for 2022 to 2024 are 426,000 yuan, 53.021 million yuan, and 743 million yuan, respectively, indicating substantial growth [3]. - Despite revenue growth, Muxi is facing significant net losses projected at 780 million yuan, 870 million yuan, and 1.41 billion yuan over the same period, totaling 3.06 billion yuan in losses [3]. Market Context - The domestic AI chip market is still in its early stages, with increasing penetration rates for local brands, but lacking a clear competitive landscape [1]. - The rise of domestic GPU manufacturers is driven by the growth of AI models, the "East Data West Computing" initiative, and ongoing policies promoting domestic innovation [5]. - By 2025, domestic AI chips are expected to account for 40% of the AI server market in China, while NVIDIA's share is projected to decrease to 41.5% [7]. Policy Environment - The recent reforms in the Sci-Tech Innovation Board have created a more favorable environment for unprofitable but technologically advanced companies like Muxi, signaling a shift towards supporting "hard tech" enterprises [4].
华为云肖霏: 找准AI技术锚点,做智能时代更懂政企的云
Sou Hu Cai Jing· 2025-06-21 21:35
深圳商报•读创客户端记者 陈姝 肖霏通过四个不同行业的实践,向与会嘉宾分享华为云Stack如何帮助不同角色的政企用户实现工作更 简单高效。 在金融,华为云Stack为某国有大行搭建统一算力平台,让数据中心工程师能够快速建设与灵活扩展智 算集群,2天内完成106个DeepSeek R1实例的快速上线部署,效率相比传统裸机部署提升70%。 华为混合云总裁肖霏 肖霏在会上正式宣布,华为云Stack将在下半年率先成为适配CloudMatrix 384超节点的混合云,让政企 客户也能在本地拥有自己的云上超节点,为智能跃迁提供澎湃AI算力。 目前,华为云Stack能够提供120多个云服务和50多个场景化解决方案,已成为新兴亚太与中国混合云市 场的领导者,在政务、金融、制造等领域连续多年保持市场份额第一。 依托长期服务政企用户的经验,华为云Stack深刻认识到政企用户并不是一个笼统的群体,而是有清晰 的角色分类、不同的场景和使用诉求。在智能时代,理解用户、为细分用户群提供具体软件与AI能力 就显得尤为重要。政企用户主要可以划分为四类:数据中心工程师、数据工程师、AI算法模型应用工 程师、应用开发工程师。 围绕这四类政企用户 ...
昇腾“算力突围战”:让中国算力训练出全球一流模型
第一财经· 2025-06-18 12:16
"虽然单芯片还落后美国一代,但用数学补物理、非摩尔补摩尔,用群计算补单芯片,在结果上也能 达到实用状况。"华为创始人任正非近期的一次公开发声,向外界罕见透露了目前华为芯片研发的最 新进展。 在华为过去长达六年的技术"补洞"中,围绕在包括芯片、软件等根技术上的布局一直是外界关注的 焦点,尤其是人工智能时代加速到来,以昇腾为核心的 AI 算力能力正在成为中国厂商在全球计算生 态卡位战中的重要变量。 虽然英伟达 CEO 黄仁勋视华为为最强劲的对手,在单芯片工艺受限的大环境下,华为算力能力依然 面临着各种声音。华为在 AI 上能走多远?是否会因为工艺制程而落后?昇腾芯片被"警告"是否会有 使用风险?此次任正非的表态,或许也是对这些问题的间接回应。 事实上,当全球 AI 产业还在为万亿参数模型的算力门槛焦虑时,中国正在以一种独特的"系统工 程"思维方式重构这场技术竞赛的底层逻辑。从 DeepSeek 用算法优化刷新全球推理速度纪录,到 昇腾超节点实现 300Pflops 算力的突破,中国算力产业正在上演一场从 " 单点突破 " 到 " 系统致 胜 " 的范式革命。 在摩尔定律逼近量子墙的当下,这种将硬件堆叠、算法优化与 ...
华为突破制裁的密码,藏在“384超节点”中
虎嗅APP· 2025-06-17 10:55
HUAWEI X HUXIU 在通往通用人工智能(AGI)的路上,如何像其他领域一样实现弯道超车,是业界绕不开的 话题。 在过去的十余年时间里,各项单点技术飞速演进,但随着单点技术演进的边际效应递减和系 统复杂度的提升,系统性能的天花板逐步从单点技术的上限演变成系统工程上限:单点优势 越来越像是精致的零件,提升空间有限;但采用系统工程创新,各个部分完美配合、高效协 同,实现整个系统的效能最优,才有更积极的现实意义。 如何在发挥单点技术优势的同时,以整体视角重新构建路径,通过对复杂系统的极致把控与 再组织、找到新的突破可能?解决这个看似不可能的问题,就有望为我们独立引领最前沿技 术发展创造条件。 近期,虎嗅将推出《华为技术披露集》系列内容,通过一系列技术报告,首次全面详述相关 技术细节,为业界提供参考价值。 我们期待通过本系列内容,携手更多伙伴共同构建开放协作的生态系统,助力昇腾生态在中 国的蓬勃发展。 "以非摩尔补摩尔、以集群补单芯片" 在讨论华为如何短时间内实现赶超的问题前,我们需要先明确一个问题:"384超节点"算是华 为在制裁下的无奈之举吗? 不完全是。 除了制裁下寻求破局这个角度,华为打造"超节点"这 ...
华为“算力核弹”超越英伟达的秘密
Guan Cha Zhe Wang· 2025-06-12 14:21
Core Viewpoint - The emergence of Huawei's Ascend CLoudMatrix 384 supernode, which surpasses NVIDIA's flagship NVL72 system by 70% in computing power, signifies a shift in the AI computing landscape from single-point breakthroughs to system-level innovations, driven by the need to overcome traditional computing limitations under U.S. sanctions [1][6][29]. Group 1: AI Computing Landscape - The AI computing race is transitioning from hardware-centric approaches to architecture redefinition, with Huawei's innovations highlighting a unique path for China's system-level advancements [1][6]. - Huang Renxun, CEO of NVIDIA, has expressed increasing anxiety regarding China's rapid advancements in AI technology, emphasizing the impossibility of halting China's progress in this field [2][5][9]. Group 2: Huawei's Technological Advancements - Huawei's Ascend CLoudMatrix 384 supernode utilizes domestic Ascend chips and achieves a total computing power of 300 PFlops, significantly exceeding NVIDIA's NVL72 system [1][6][14]. - The architecture of the Ascend CLoudMatrix 384 supernode is based on a "fully equal architecture," which enhances communication efficiency and overcomes traditional bottlenecks such as the "memory wall" and "communication wall" [1][18][20]. Group 3: Competitive Dynamics - The U.S. government's sanctions have prompted NVIDIA to incur a $5.5 billion inventory loss, while simultaneously highlighting the importance of the Chinese market for NVIDIA's future [5][6]. - Huang Renxun acknowledges that China's advancements in AI technology could lead to a significant reduction in NVIDIA's market share in China, which has dropped from 95% to 50% in recent years [9][22]. Group 4: System-Level Innovations - The Ascend CLoudMatrix 384 supernode's design allows for the integration of thousands of cards, enabling it to support larger models and enhance training efficiency [1][6][14]. - The use of optical communication technology in the Ascend CLoudMatrix 384 supernode allows for high bandwidth and low latency, which is crucial for large-scale AI model training [20][21]. Group 5: Future Implications - The successful deployment of the Ascend CLoudMatrix 384 supernode and its ability to train large models like the Pangu Ultra MoE model demonstrates the potential for domestic AI infrastructure to achieve self-sufficiency [26][29]. - The emergence of Huawei's technology provides a viable alternative to NVIDIA's offerings, potentially reshaping the competitive landscape in the AI industry [22][29].
昇腾910系列全年出货量下调
傅里叶的猫· 2025-06-11 11:31
随着美国针对GPU的限制越来越多,大家对国产GPU尤其是华为昇腾系列GPU的表现和出货量都非 常关心,前段时间老黄还说华为芯片性能已超H200,华为的CloudMatrix云架构也已经超英伟达。当 然老黄这么说肯定是有夸张的成分,他一直对美国政府出台的这些限制政策很不爽,既让英伟达损 失了很多中国的大客户,又让国产GPU在这段时间取得了突飞猛进的发展。 由于华为从未对外公布过昇腾系列的出货量,因此我们只能参考第三方的调研,本文中关于昇腾910 系列出货量的数据,是参考自本营最近的一份调研纪要。 国产GPU采购情况 相信本文的读者们应该都看到过关于CSP大厂的资本开支,字节预计2025年投入1600亿,阿里宣布 未来3年投入3800亿建设云和AI硬件基础设施,腾讯预计2025投入900亿。根据公众号"AI半导体专 研"的一个调研,在H20被禁后,国内大厂对于国产GPU卡的态度和采购计划如下: 字节最为积极,主要采用寒武纪和昇腾,并广泛测试国内其他品牌,2025年计划增加采购这些品牌 的卡。 阿里则较为谨慎,除了自研的平头哥外,还上线了部分昇腾卡,但性能表现不佳;2025年预计首次 采购海光和寒武纪的卡,同时继续 ...
“被误解”的任正非:芯片“断章取义”报道何时休?
Sou Hu Cai Jing· 2025-06-11 02:11
《人民日报》采访原文中,任正非原话的确是"芯片问题其实没必要担心,用叠加和集群等方法,计算结果上与最先进水平是相当的。"不过,这一个回 答, 实际续接的是"您对人工智能的未来背景怎么看"。也就是说,任正非的本意并没有那么"高调",而是说中国在AI领域有芯片可用,正因为在单芯片 性能上落后美国芯片不少,所以昇腾才要剑走偏锋,通过堆叠(istack)和集群(Cluster)去力求达到英伟达那种性能。 其实只需要把原来的标题改成"AI芯片的问题没必要担心",仅仅一词之差,整体的语义就回归了。实际原文中任正非整体态度很谦虚,但看到这样的报 道,或许有些人就会认为任正非很"狂"。此类的断章取义其实还有很多…… "被误解"的任正非 实际上,如果经常关注国外报道,也许你会看到这样的字眼——华为创始人认为中国无需担心美国芯片制裁。 但如果细细品味一下《人民日报》的原文报道,就会发现,这种说法完全是境外媒体的捏造和臆测。任正非这一篇采访非常振奋人心,不仅提振了国内芯 片行业的士气,也非常谦逊,接受批评,正视不足,是一篇值得细细品味的报道。 中共中央办公厅国务院办公厅关于进 保障和改善民生 着力解决群众急难愁盼的意见 (2025 ...