Workflow
昇腾CloudMatrix 384
icon
Search documents
华为芯片,究竟有多牛?(上)
0:00 21世纪经济报道记者倪雨晴 深圳报道 华为的昇腾,让英伟达黄教主都坐不住了。他公开表示,华为昇腾CloudMatrix 384超节点,部分性能上 甚至超过英伟达的产品。 华为的384超节点方案,就像全真七子用剑阵打黄药师,集群一起上,黄药师还真有点招架不住。 海外专业机构SemiAnalysis更是直接点名:384超节点的整体计算能力是英伟达GB200机柜的1.6倍! 在单芯片性能受限、制裁持续的情况下,华为昇腾是真能打,还是"自嗨"?它是如何与英伟达竞争的? 国产算力究竟到了什么水平?还有什么差距? 今天,我们就带着这些问题,一口气了解对垒英伟达的国产芯片,昇腾。 和英伟达"掰手腕" 目前昇腾最主力的产品叫"昇腾910"。但以往的昇腾芯片,更多是作为"备胎"使用的——因为美国断 供,英伟达、AMD最高端的芯片买不到,很多厂商只能硬着头皮用国产,而昇腾已经是国产芯片中的 佼佼者。 过去几年,昇腾其实主要用在AI"推理"环节,也就是模型训练好之后,用它来支持大模型生成内容、聊 天等应用环节。但模型训练?说实话——很少用国产芯片,原因也简单:单卡性能弱、生态不够用、系 统稳定性差。 但这一切,在2024 ...
科创板迎硬核玩家:沐曦IPO获受理 ,国产GPU上市提速
Core Viewpoint - The rise of domestic AI chip companies, particularly Muxi Integrated Circuit (Shanghai) Co., Ltd., is accelerating their entry into the capital market, with Muxi's IPO on the Sci-Tech Innovation Board being a significant event in the GPU sector [1][2]. Company Overview - Muxi aims to raise 3.904 billion yuan for the development and industrialization of next-generation general-purpose GPUs, AI inference chips, and advanced heterogeneous computing architectures [1]. - Founded in 2020, Muxi is part of the "Four Little Dragons" of domestic GPUs, alongside companies like Moore Threads and Birran Technology [2]. - Muxi's flagship product, the "Xiyun C series," is a self-developed GPU chip that has achieved significant sales and application in AI public computing platforms [3]. Financial Performance - Muxi's revenue projections for 2022 to 2024 are 426,000 yuan, 53.021 million yuan, and 743 million yuan, respectively, indicating substantial growth [3]. - Despite revenue growth, Muxi is facing significant net losses projected at 780 million yuan, 870 million yuan, and 1.41 billion yuan over the same period, totaling 3.06 billion yuan in losses [3]. Market Context - The domestic AI chip market is still in its early stages, with increasing penetration rates for local brands, but lacking a clear competitive landscape [1]. - The rise of domestic GPU manufacturers is driven by the growth of AI models, the "East Data West Computing" initiative, and ongoing policies promoting domestic innovation [5]. - By 2025, domestic AI chips are expected to account for 40% of the AI server market in China, while NVIDIA's share is projected to decrease to 41.5% [7]. Policy Environment - The recent reforms in the Sci-Tech Innovation Board have created a more favorable environment for unprofitable but technologically advanced companies like Muxi, signaling a shift towards supporting "hard tech" enterprises [4].
华为突破制裁的密码,藏在“384超节点”中
虎嗅APP· 2025-06-17 10:55
HUAWEI X HUXIU 在通往通用人工智能(AGI)的路上,如何像其他领域一样实现弯道超车,是业界绕不开的 话题。 在过去的十余年时间里,各项单点技术飞速演进,但随着单点技术演进的边际效应递减和系 统复杂度的提升,系统性能的天花板逐步从单点技术的上限演变成系统工程上限:单点优势 越来越像是精致的零件,提升空间有限;但采用系统工程创新,各个部分完美配合、高效协 同,实现整个系统的效能最优,才有更积极的现实意义。 如何在发挥单点技术优势的同时,以整体视角重新构建路径,通过对复杂系统的极致把控与 再组织、找到新的突破可能?解决这个看似不可能的问题,就有望为我们独立引领最前沿技 术发展创造条件。 近期,虎嗅将推出《华为技术披露集》系列内容,通过一系列技术报告,首次全面详述相关 技术细节,为业界提供参考价值。 我们期待通过本系列内容,携手更多伙伴共同构建开放协作的生态系统,助力昇腾生态在中 国的蓬勃发展。 "以非摩尔补摩尔、以集群补单芯片" 在讨论华为如何短时间内实现赶超的问题前,我们需要先明确一个问题:"384超节点"算是华 为在制裁下的无奈之举吗? 不完全是。 除了制裁下寻求破局这个角度,华为打造"超节点"这 ...
华为“算力核弹”超越英伟达的秘密
Guan Cha Zhe Wang· 2025-06-12 14:21
Core Viewpoint - The emergence of Huawei's Ascend CLoudMatrix 384 supernode, which surpasses NVIDIA's flagship NVL72 system by 70% in computing power, signifies a shift in the AI computing landscape from single-point breakthroughs to system-level innovations, driven by the need to overcome traditional computing limitations under U.S. sanctions [1][6][29]. Group 1: AI Computing Landscape - The AI computing race is transitioning from hardware-centric approaches to architecture redefinition, with Huawei's innovations highlighting a unique path for China's system-level advancements [1][6]. - Huang Renxun, CEO of NVIDIA, has expressed increasing anxiety regarding China's rapid advancements in AI technology, emphasizing the impossibility of halting China's progress in this field [2][5][9]. Group 2: Huawei's Technological Advancements - Huawei's Ascend CLoudMatrix 384 supernode utilizes domestic Ascend chips and achieves a total computing power of 300 PFlops, significantly exceeding NVIDIA's NVL72 system [1][6][14]. - The architecture of the Ascend CLoudMatrix 384 supernode is based on a "fully equal architecture," which enhances communication efficiency and overcomes traditional bottlenecks such as the "memory wall" and "communication wall" [1][18][20]. Group 3: Competitive Dynamics - The U.S. government's sanctions have prompted NVIDIA to incur a $5.5 billion inventory loss, while simultaneously highlighting the importance of the Chinese market for NVIDIA's future [5][6]. - Huang Renxun acknowledges that China's advancements in AI technology could lead to a significant reduction in NVIDIA's market share in China, which has dropped from 95% to 50% in recent years [9][22]. Group 4: System-Level Innovations - The Ascend CLoudMatrix 384 supernode's design allows for the integration of thousands of cards, enabling it to support larger models and enhance training efficiency [1][6][14]. - The use of optical communication technology in the Ascend CLoudMatrix 384 supernode allows for high bandwidth and low latency, which is crucial for large-scale AI model training [20][21]. Group 5: Future Implications - The successful deployment of the Ascend CLoudMatrix 384 supernode and its ability to train large models like the Pangu Ultra MoE model demonstrates the potential for domestic AI infrastructure to achieve self-sufficiency [26][29]. - The emergence of Huawei's technology provides a viable alternative to NVIDIA's offerings, potentially reshaping the competitive landscape in the AI industry [22][29].
华为的准万亿大模型,是如何训练的?
虎嗅APP· 2025-05-30 10:18
现在,请大家一起数一下"1"、"2"。 OK,短短2秒钟时间,一个准万亿MoE大模型就已经吃透如何解一道高等数学大题了。 HUAWEI X HUXIU 三分之一个世纪前,加拿大学者们提出了经典的MoE模型神经网络结构,在人类探索AI的 「石器时代」中,为后世留下了变革的火种。 近十年前,美国硅谷的互联网巨擎在理论和工程等方面,突破了MoE模型的原始架构,让这 个原本被置于学术高阁的理念,化身成为了随后AI竞争的导火索。 如今,后发优势再一次来到了大洋此岸,以华为为代表的中国科技企业,纷纷提出对MoE架 构的优化重组方案。尤其是华为的MoGE架构,不仅克服了MoE负载不均衡及效率瓶颈的弊 病,还能够降本增效,便于训练和部署。 AI之战远未终结,但正如在其他领域中「多快好省」的中国产业底色一样,大模型这棵生于 西方长于彼岸的科技树,也同样会被东方智慧经手后,进化为更加普适和亲切的工具。 近期,虎嗅将打造《华为技术披露集》系列内容,通过一连串的技术报告,首次全面披露相 关的技术细节。 希望本系列内容能为业界起到参考价值,也希望更多人能与华为一起,共同打造长期持续的 开放协作生态环境,让昇腾生态在中国茁壮成长。 《华 ...
华为揭秘:国产昇腾训出世界一流大模型
Guan Cha Zhe Wang· 2025-05-30 08:35
在训练方法上,华为团队首次披露在昇腾CloudMatrix 384超节点上,高效打通大稀疏比MoE强化学习 (RL)后训练框架的关键技术,使RL后训练进入超节点集群时代。同时,在5月初发布的预训练系统 加速技术基础上,在不到一个月的时间内,华为团队又完成了一轮迭代升级,包括:适配昇腾硬件的自 适应流水掩盖策略,进一步优化算子执行序,进一步降低Host-Bound以及提升EP通信的掩盖;自适应 管理内存优化策略的开发;数据重排实现DP间Attention负载均衡;以及昇腾亲和的算子优化,这些技 术实现万卡集群预训练MFU由30%大幅提升至41%。 此外,近期发布的盘古Pro MoE大模型,在参数量仅为720亿,激活160亿参数量的情况下,通过动态激 活专家网络的创新设计,实现了以小打大的优异性能,甚至可以媲美千亿级模型的性能表现。在业界权 威大模型榜单SuperCLUE最新公布的2025年5月排行榜上,位居千亿参数量以内大模型排行并列国内第 一。 华为盘古Ultra MoE和盘古Pro MoE系列模型的发布,证明华为不仅完成了国产算力+国产模型的全流程 自主可控的训练实践,同时在集群训练系统的性能上也实现了业界 ...
智通决策参考︱5月行情值得期待
Sou Hu Cai Jing· 2025-05-06 00:53
【主编观市】 四月最后一天恒指往上,给五月行情带来指引。 一般放长假海外市场上涨的概率偏大,美股有几个催化: 1,海外AI巨头数据超预期,假期内大涨。如微软、mate等。 2,美国4月非农数据超预期。新增17.7万,大幅超出预估的13.8万增量。 3,特朗普做预期管理,不断释放各种签署协议的所谓利好。 优必选(09880) 2024 年公司实现营收 13.05 亿元,同比+23.7%;毛利润 3.74 亿元,同比+12.4%。主要得益于教育智能 机器人和定制智能机器人产品收入增长。 但这依然只能作为短期来看,看下伯克希尔的现金储备从2024年底的约3340亿美元上升至创纪录的3477 亿美元,显示巴菲特仍在等待合适的投资机会。 当地时间5月7日,美联储将公布最新利率决议。目前市场一致预期,美联储将按兵不动。 对国内而言,汇率走强才是关键,5月5日,离岸人民币盘中一度升穿7.20关口,为去年11月以来首次, 创近半年以来新高。亚洲其它货币也延续上周五的涨势,集体向上脉冲,这意味着美国经济衰退概率上 升、未来利率可能走低。市场普遍预期美元可能续贬值。 财政部今年赤字率按4%安排,比去年提高1个百分点,赤字规模达到 ...
910C的下一代
信息平权· 2025-04-20 09:33
无论如何,眼下的线索已经可以假定CloudMatrix和UB-Mesh是在描述两种不同的硬件形态了。 在进一步分析这两个事物的关系前,想先引用一下前两天SemiAnalysis关于CloudMatrix的分析。 SemiAnalysis的分析师无疑都非常专业,比中国那些为了炒HWJ或者光纤电缆的小作文可强多了。 可文章中提到的关于CloudMatrix的两个弱点,却让人觉得他们又有点那么点菜菜。 以下文章来自夏 core 转发的神秘网友,是谁咱也不知道,总之截图了我们群里的消息 ... 华为发布的昇腾CloudMatrix 384超节点,号称采用UB互联完成了384颗NPU的互联,并号称能够与 Nvidia的NVL72比肩。好巧不巧,不久前的三月底,华为还发布了一篇名为 UB-Mesh的论文 ,也描述 了一种也被称为超节点的NPU互联结构。 确实也有传言说CloudMatrix的组网就是UB-Mesh,但也有人说不是,但如果不是,他们之间是个什么 关系呢? 不难发现,UB-Mesh的硬件全是1U的超薄Chasis,而CloudMatrix的Rack中,怎么看都找不到1U框的结 构。而且 ,如果数数量的话,UB ...