华为打造“最强超节点”,这项全球领先技术很关键
Guan Cha Zhe Wang·2026-02-10 03:10
2025年以来,超节点(SuperPod)作为新的AI算力基础设施,不断成为行业焦点。观察者网也曾深度报 道过华为的昇腾384超节点,它通过高速互联总线将384颗昇腾芯片连接起来,在超节点算力规模、网络 互联带宽、内存总带宽等多个指标上,赶超了国外厂商的旗舰系统。 但当时一些讨论认为,华为是靠堆砌了384颗芯片,才超越了英伟达72颗芯片,而后很多厂商也跟进了 超节点的概念。一时间,算力行业掀起了建设超节点的热潮。那回到最初的问题,超节点就是单纯的堆 芯片吗?华为是通过暴力堆砌芯片赶超英伟达的吗?超节点和传统的计算集群区别在哪? 文 观察者网 吕栋 在一些观点看来,算力缺口大可以通过大量建设服务器集群堆卡来解决。这么说听起来有一定道理,但 真实情况远没有这么简单。根据Meta公布的论文,万卡集群训练时算力利用率仅约38%,粗暴堆卡可能 会造成62%的算力浪费,并且模型训练会3个小时中断一次。 这是因为,集群网络通信已成为当前大模型训练和推理的最大挑战。以DeepSeek这种混合专家模型 (MoE)为例,每个"专家"如果不能有效沟通,NPU就会由于没有足够数据计算而闲置,进而形成 1+1<2的结果。换句话说,如果 ...