MindSpeed

Search documents
不用GPU,大模型每2秒吃透一道高数大题!这就是华为的实力
雷峰网· 2025-05-30 09:48
" 从算力利用率突破到后训练吞吐革新,华为用技术创新定义国产 大模型训练标杆。 " 作者丨李希 现在,请大家一起 数一下"1"、"2" 。 OK,短短2秒钟时间,一个 准万亿MoE大模型 就已经 吃透 如何解一道 高等数学大题 了! 而且啊,这个大模型还是 不用GPU 来训练,全流程都是大写的 "国产" 的那种。 这,就是华为通过 "昇腾+Pangu Ultra MoE" 这套组合拳解锁的效果—— 不仅实现了国产算力与国产模型全流程自主可控的训练闭环,更是在集群训练系统性能方面达到行业领先 水平。 有多领先?来看一组数据: 预训练阶段:昇腾Atlas 800T A2万卡集群MFU提升至41% 后训练阶段:单CloudMatrix 384超节点吞吐达35K Tokens/s 值得一提的是,华为还 首次 把背后的一大秘籍给亮了出来。 具体来说,华为在这次发布的 技术报告 中,披露了在昇腾CloudMatrix 384超节点上,高效打通大稀疏 比MoE强化学习后训练框架的关键技术。 此举可以说是让以强化学习(RL)为核心机制的后训练,进入到了超节点集群时代。 01 不用GPU的"炼"准万亿大模型方法 在深入华为Pa ...
阿里Qwen3能否成为下一个DeepSeek?
3 6 Ke· 2025-05-07 11:38
4月29日凌晨,阿里巴巴旗下通义千问团队正式发布并开源新一代模型Qwen3。此次发布的Qwen3系列涵盖了多个模型类型,包括2款参数规模为30B和 235B的混合专家(MoE)模型,以及6款参数从0.6B到32B的密集模型。 预训练数据量的提升也是Qwen3的一大亮点。官方数据显示,其数据量跃升至36T,是Qwen2.5的三倍之多。多轮强化学习的运用,将非思考模式巧妙融 入思考模型,优化了模型的智能处理逻辑,进一步提升了模型在推理、指令遵循、工具调用以及多语言能力等方面的表现。 作为国内首个混合推理模型家族,一经推出便迅速引发开源圈的激烈讨论:Qwen3能否成为下一个DeepSeek? 发布后不久,华为计算官方发文称,昇腾MindSpeed和MindIE一直以来同步支持Qwen系列模型,此次Qwen3系列开源后,已在MindSpeed和MindIE中实现 开箱即用,完成了Qwen3的0Day适配。海光信息方面也表示,其DCU迅速完成对全部8款模型的无缝适配与调优。 "发布第二天,我们已经完成了本地化部署Qwen3-30B-A3B,用了单卡4090,目前对C端用户开放。"共绩算力COO王鹏告诉《IT时报》记者, ...
华为昇腾全系列支持Qwen3
news flash· 2025-04-29 10:31
Core Insights - The article highlights the launch of Alibaba's Qwen3 model, which is the first "hybrid reasoning model" in China, integrating "fast thinking" and "slow thinking" into a single framework [1] - Huawei's Ascend supports the deployment of the Qwen3 model across its entire series, allowing developers to utilize it seamlessly in MindSpeed and MindIE [1] - The Qwen3 model is designed to provide quick responses for simple queries with low computing power while enabling multi-step deep reasoning for complex questions, significantly reducing computational resource consumption [1]
【昇腾全系列支持Qwen3】4月29日讯,据华为计算公众号,Qwen3于2025年4月29日发布并开源。此前昇腾MindSpeed和MindIE一直同步支持Qwen系列模型,此次Qwen3系列一经发布开源,即在MindSpeed和MindIE中开箱即用,实现Qwen3的0Day适配。
news flash· 2025-04-29 06:27
Core Insights - Huawei's Ascend series fully supports the Qwen3 model, which was released and open-sourced on April 29, 2025 [1] - The Ascend MindSpeed and MindIE have been consistently supporting the Qwen series models, ensuring immediate compatibility with Qwen3 upon its release [1]