Workflow
MindIE
icon
Search documents
从“积木堆叠”到“有机生命体”:昇腾超节点重新定义AI算力架构
Huan Qiu Wang· 2025-05-26 10:06
【环球网科技报道 记者 张阳】在人工智能加速渗透千行百业的今天,大模型的爆发式增长正推动算力需求进入新纪元。当大模型的参数量越来越大,传统 集群架构虽然可以通过不断叠加来扩展算力,但是各集群之间却受到通信效率的制约,成为大模型训练效率的绊脚石。 一边是各行各业对于AI算力的需求,另一方面在算力供给侧遇到的通信延迟吞噬算力带来的效率瓶颈、居高不下的模型训练成本, 传统集群的困局:从 " 算力堆砌 " 到 " 效率革命 " 的必然跃迁 回顾AI计算的演进历程,传统集群架构的局限性日益凸显。由独立服务器通过以太网堆叠而成的系统,在面对MoE(混合专家模型)等新型大模型时,暴 露出三大核心痛点: 首先是通信瓶颈的指数级恶化。MoE模型将任务拆解为数百个专家并行处理,导致节点间通信量呈几何级增长。传统基于RoCE协议的400G网络,在面对TB 级数据传输需求时,时延高达2ms以上,成为制约训练效率的最大短板。 其次是资源分配的粗放性。传统架构无法感知模型层间计算特征,只能进行静态资源划分。当MoE模型中不同层的专家数量动态变化时,常出现部分节点过 载、部分节点闲置的"冷热不均"现象,导致整体训练效率下降30%以上。 最 ...
华为周军:鲲鹏、昇腾已发展超过665万开发者
news flash· 2025-05-23 14:45
5月23日,鲲鹏昇腾开发者大会2025(KADC2025)在北京举办。大会现场发布一系列新技术、新工具和新 平台。面向通用计算领域,鲲鹏正式推出鲲鹏AI+解决方案,开源发布多样化算力集群软件开源社区 openFuyao,构建AI时代卓越引擎。面向AI计算领域,昇腾发布CATLASS算子模板库、MindIE Motor推 理服务加速库、推理微服务MIS,并持续升级分层开放CANN的能力、MindSpeed RL强化学习套件、大 规模专家并行推理解决方案。华为ICT Marketing部部长周军表示,华为始终坚持"硬件开放、软件开 源、使能伙伴、发展人才"的生态策略,持续投入根技术创新和系统架构创新,携手伙伴和开发者,共 同打造开放繁荣的计算产业生态。截至2025年5月,鲲鹏、昇腾已发展超过665万开发者、8800多家合作 伙伴,完成23900多个解决方案认证。华为持续打造坚实、易用的算力底座,使能开发者和伙伴,加速 行业智能化。(中证金牛座) ...
阿里Qwen3能否成为下一个DeepSeek?
3 6 Ke· 2025-05-07 11:38
4月29日凌晨,阿里巴巴旗下通义千问团队正式发布并开源新一代模型Qwen3。此次发布的Qwen3系列涵盖了多个模型类型,包括2款参数规模为30B和 235B的混合专家(MoE)模型,以及6款参数从0.6B到32B的密集模型。 预训练数据量的提升也是Qwen3的一大亮点。官方数据显示,其数据量跃升至36T,是Qwen2.5的三倍之多。多轮强化学习的运用,将非思考模式巧妙融 入思考模型,优化了模型的智能处理逻辑,进一步提升了模型在推理、指令遵循、工具调用以及多语言能力等方面的表现。 作为国内首个混合推理模型家族,一经推出便迅速引发开源圈的激烈讨论:Qwen3能否成为下一个DeepSeek? 发布后不久,华为计算官方发文称,昇腾MindSpeed和MindIE一直以来同步支持Qwen系列模型,此次Qwen3系列开源后,已在MindSpeed和MindIE中实现 开箱即用,完成了Qwen3的0Day适配。海光信息方面也表示,其DCU迅速完成对全部8款模型的无缝适配与调优。 "发布第二天,我们已经完成了本地化部署Qwen3-30B-A3B,用了单卡4090,目前对C端用户开放。"共绩算力COO王鹏告诉《IT时报》记者, ...
华为昇腾全系列支持Qwen3
news flash· 2025-04-29 10:31
Core Insights - The article highlights the launch of Alibaba's Qwen3 model, which is the first "hybrid reasoning model" in China, integrating "fast thinking" and "slow thinking" into a single framework [1] - Huawei's Ascend supports the deployment of the Qwen3 model across its entire series, allowing developers to utilize it seamlessly in MindSpeed and MindIE [1] - The Qwen3 model is designed to provide quick responses for simple queries with low computing power while enabling multi-step deep reasoning for complex questions, significantly reducing computational resource consumption [1]
【昇腾全系列支持Qwen3】4月29日讯,据华为计算公众号,Qwen3于2025年4月29日发布并开源。此前昇腾MindSpeed和MindIE一直同步支持Qwen系列模型,此次Qwen3系列一经发布开源,即在MindSpeed和MindIE中开箱即用,实现Qwen3的0Day适配。
news flash· 2025-04-29 06:27
Core Insights - Huawei's Ascend series fully supports the Qwen3 model, which was released and open-sourced on April 29, 2025 [1] - The Ascend MindSpeed and MindIE have been consistently supporting the Qwen series models, ensuring immediate compatibility with Qwen3 upon its release [1]