MindIE Motor

Search documents
从“积木堆叠”到“有机生命体”:昇腾超节点重新定义AI算力架构
Huan Qiu Wang· 2025-05-26 10:06
【环球网科技报道 记者 张阳】在人工智能加速渗透千行百业的今天,大模型的爆发式增长正推动算力需求进入新纪元。当大模型的参数量越来越大,传统 集群架构虽然可以通过不断叠加来扩展算力,但是各集群之间却受到通信效率的制约,成为大模型训练效率的绊脚石。 一边是各行各业对于AI算力的需求,另一方面在算力供给侧遇到的通信延迟吞噬算力带来的效率瓶颈、居高不下的模型训练成本, 传统集群的困局:从 " 算力堆砌 " 到 " 效率革命 " 的必然跃迁 回顾AI计算的演进历程,传统集群架构的局限性日益凸显。由独立服务器通过以太网堆叠而成的系统,在面对MoE(混合专家模型)等新型大模型时,暴 露出三大核心痛点: 首先是通信瓶颈的指数级恶化。MoE模型将任务拆解为数百个专家并行处理,导致节点间通信量呈几何级增长。传统基于RoCE协议的400G网络,在面对TB 级数据传输需求时,时延高达2ms以上,成为制约训练效率的最大短板。 其次是资源分配的粗放性。传统架构无法感知模型层间计算特征,只能进行静态资源划分。当MoE模型中不同层的专家数量动态变化时,常出现部分节点过 载、部分节点闲置的"冷热不均"现象,导致整体训练效率下降30%以上。 最 ...
华为周军:鲲鹏、昇腾已发展超过665万开发者
news flash· 2025-05-23 14:45
5月23日,鲲鹏昇腾开发者大会2025(KADC2025)在北京举办。大会现场发布一系列新技术、新工具和新 平台。面向通用计算领域,鲲鹏正式推出鲲鹏AI+解决方案,开源发布多样化算力集群软件开源社区 openFuyao,构建AI时代卓越引擎。面向AI计算领域,昇腾发布CATLASS算子模板库、MindIE Motor推 理服务加速库、推理微服务MIS,并持续升级分层开放CANN的能力、MindSpeed RL强化学习套件、大 规模专家并行推理解决方案。华为ICT Marketing部部长周军表示,华为始终坚持"硬件开放、软件开 源、使能伙伴、发展人才"的生态策略,持续投入根技术创新和系统架构创新,携手伙伴和开发者,共 同打造开放繁荣的计算产业生态。截至2025年5月,鲲鹏、昇腾已发展超过665万开发者、8800多家合作 伙伴,完成23900多个解决方案认证。华为持续打造坚实、易用的算力底座,使能开发者和伙伴,加速 行业智能化。(中证金牛座) ...