昇思MindSpore

Search documents
华为突破制裁的密码,藏在“384超节点”中
虎嗅APP· 2025-06-17 10:55
HUAWEI X HUXIU 在通往通用人工智能(AGI)的路上,如何像其他领域一样实现弯道超车,是业界绕不开的 话题。 在过去的十余年时间里,各项单点技术飞速演进,但随着单点技术演进的边际效应递减和系 统复杂度的提升,系统性能的天花板逐步从单点技术的上限演变成系统工程上限:单点优势 越来越像是精致的零件,提升空间有限;但采用系统工程创新,各个部分完美配合、高效协 同,实现整个系统的效能最优,才有更积极的现实意义。 如何在发挥单点技术优势的同时,以整体视角重新构建路径,通过对复杂系统的极致把控与 再组织、找到新的突破可能?解决这个看似不可能的问题,就有望为我们独立引领最前沿技 术发展创造条件。 近期,虎嗅将推出《华为技术披露集》系列内容,通过一系列技术报告,首次全面详述相关 技术细节,为业界提供参考价值。 我们期待通过本系列内容,携手更多伙伴共同构建开放协作的生态系统,助力昇腾生态在中 国的蓬勃发展。 "以非摩尔补摩尔、以集群补单芯片" 在讨论华为如何短时间内实现赶超的问题前,我们需要先明确一个问题:"384超节点"算是华 为在制裁下的无奈之举吗? 不完全是。 除了制裁下寻求破局这个角度,华为打造"超节点"这 ...
从开源共建到生态繁荣:昇思MindSpore支持Day0迁移、一键部署
财联社· 2025-06-12 10:59
1. 迁得快:让三方框架模型 "零成本"迁移,避免重复造轮子,同时模型精度完全对齐。 2 . 部署快:训转推全流程自动化,让大模型部署像执行一行命令一般敏捷高效 。 Figure 1 MindSpore生态快速迁移解决方案的技术架构 接下来,我们将揭开昇思 MindSpore的破局之道。 一、支持训练Day0迁移,构建跨框架的"无感智能翻译"能力 当大模型架构日新月异,开发者最怕被生态绑定。昇思 MindSpore通过三重兼容术打通主流 技术栈 , 支持 主流 加速库 模型0代码迁移 ,通过精度自动对比工具 实现跨框架、跨版本、 跨策略快速调优, 精度对齐原模型, 实现 在分布式并行策略保持不变的情况下,训练性能提 升5 %+ 。 在训练生态方面,通过 MindSpeed /Megatron桥接层实现 PyTorch 模型零代码迁移,训练 脚本可直接运行; 通过动态图能力重构,昇思让 PyTorch 开发者获得"原生体验",同时借力 MSAdapter 工具自动转换9 5 %以上接口, 主流模型如 DeepSeek 、 Pan g u 等 迁移损耗 逼近于零。 大模型发展日新月异,新的大模型层出不穷,参数规模 ...
Day0迁移、一键部署,昇思MindSpore打造昇腾的“咖啡伴侣”
21世纪经济报道· 2025-06-12 10:17
一、支持训练Day0迁移,构建跨框架的"无感智能翻译"能力 当大模型架构日新月异,开发者最怕被生态绑定。昇思Mi n dSp o r e通过三重兼容术打通主流 技术栈,支持主流加速库模型0代码迁移,通过精度自动对比工具实现跨框架、跨版本、跨策 略 快 速 调 优 , 精 度 对 齐 原 模 型 , 实 现 在 分 布 式 并 行 策 略 保 持 不 变 的 情 况 下 , 训 练 性 能 提 升 5%+。 在训练生态方面,通过Mi n dSp e e d /Me g a tr o n桥接层实现PyTo r c h模型零代码迁移,训练脚本 可 直 接 运 行 ; 通 过 动 态 图 能 力 重 构 , 昇 思 让 PyTo r c h 开 发 者 获 得 " 原 生 体 验 " , 同 时 借 力 MSAd a p t e r 工 具 自 动 转 换 9 5% 以 上 接 口 , 主 流 模 型 如 De e pSe e k 、 Pa n g u 等 迁 移 损 耗 逼 近 于 零。 迁移只是起点,性能才是硬道理。昇思Mi n dSp o r e构建了框架差异化技术,进一步提升模型 训练效率: 昇思MindSp ...
Day0迁移、一键部署,华为开源的昇思MindSpore成为大模型开发的“万能钥匙”
量子位· 2025-06-12 08:17
华为开源的昇思MindSpore ,了解一下。 金磊 发自 凹非寺 量子位 | 公众号 QbitAI 没有一个大模型可以一统天下。 这,或许已经成为了AI大模型时代行业里的一个共识。 在如此背景之下,面对众多且日新月异的主流大模型和AI技术,如何能 在一个框架、生态下去体验 ,却成了开发者们"老大难"的问题。 难道就没有一个又快又好又方便的解决办法吗? 有的—— 在这里,主流SOTA大模型的"搬家"是这样的—— 训练Day0迁移 : 只需改动极少极少的代码就OK,并且精度和性能都在线。 推理 是 一键部署 的: 训练转推理全流程自动化,20多个主流大模型开箱即用,百亿参数模型加载只需不到30秒。 △ MindSpore生态快速迁移解决方案的技术架构 那么昇思MindSpore是如何做到,我们继续往下看。 改4行代码,"搬家"DeepSeek-V3 为了让迁移大模型这件事变得无感知,昇思MindSpore"翻译神器"—— MSAdapter 。 简单来说,这个工具可以把其他框架的代码转换成MindSpore能看懂的语言,从而实现 "零损耗" 迁移。 比如PyTorch写的训练脚本,直接在MindSpore里运行 ...
Day0迁移、一键部署,华为开源的昇思MindSpore成为大模型开发的“万能钥匙”
量子位· 2025-06-12 08:16
有的—— 金磊 发自 凹非寺 量子位 | 公众号 QbitAI 没有一个大模型可以一统天下。 在如此背景之下,面对众多且日新月异的主流大模型和AI技术,如何能 在一个框架、生态下去体验 ,却成了开发者们"老大难"的问题。 难道就没有一个又快又好又方便的解决办法吗? 这,或许已经成为了AI大模型时代行业里的一个共识。 华为开源的昇思MindSpore ,了解一下。 在这里,主流SOTA大模型的"搬家"是这样的—— 训练Day0迁移 : 只需改动极少极少的代码就OK,并且精度和性能都在线。 △ MindSpore训练Day0迁移方案 推理 是 一键部署 的: 训练转推理全流程自动化,20多个主流大模型开箱即用,百亿参数模型加载只需不到30秒。 △ MindSpore生态快速迁移解决方案的技术架构 那么昇思MindSpore是如何做到,我们继续往下看。 改4行代码,"搬家"DeepSeek-V3 为了让迁移大模型这件事变得无感知,昇思MindSpore"翻译神器"—— MSAdapter 。 简单来说,这个工具可以把其他框架的代码转换成MindSpore能看懂的语言,从而实现 "零损耗" 迁移。 比如PyTorch ...
独家秘籍:探索昇思MindSpore如何让SOTA模型迁得快、对得齐
雷峰网· 2025-06-12 08:16
" 昇思MindSpore支持大模型训练Day0迁移、推理一键部署,携 手开发者共筑开源生态。 " 编辑丨 李希 大模型发展日新月异,新的大模型层出不穷,参数规模从十亿级跃升至万亿级,模型结构从稠密到稀疏, 应用范式走向多模态、 Agent… 如此多的模型和技术如何在昇腾上快速的使能和体验,是昇腾开发者的 核心诉求。昇思MindSpore "海纳百川",全面融入主流生态,全面优化训练与推理全流程开发体验,让 开发者用极小成本完成SOTA大模型的迁移 ,昇思 Mind Spore 需攻克两大关键挑战: 1. 迁得快:让三方框架模型 "零成本"迁移,避免重复造轮子,同时模型精度完全对齐。 2. 部署快:训转推全流程自动化,让大模型部署像执行一行命令一般敏捷高效。 迁移只是起点,性能才是硬道理。昇思 Mind Spore 构建了框架差异化技术,进一步提升模型训练效率: 02 支持推理一键部署,分钟级拉起模型服务 在推理部署方面,借助 vLLM-MindSpore插件实现HuggingFace模型半小时部署上线。 面对千亿参数模 型,昇思用三层部署范式重构推理链路: Figure 1 MindSpore生态快速迁移解 ...
独家秘籍:探索昇思MindSpore如何让SOTA模型迁得快、对得齐
雷峰网· 2025-06-12 08:15
2. 部署快:训转推全流程自动化,让大模型部署像执行一行命令一般敏捷高效。 Figure 1 MindSpore生态快速迁移解决方案的技术架构 接下来,我们将揭开昇思 MindSpore的破局之道。 01 支持训练Day0迁移,构建跨框架的"无感智能翻译"能力 " 昇思MindSpore支持大模型训练Day0迁移、推理一键部署,携 手开发者共筑开源生态。 " 编辑丨 李希 大模型发展日新月异,新的大模型层出不穷,参数规模从十亿级跃升至万亿级,模型结构从稠密到稀疏, 应用范式走向多模态、 Agent… 如此多的模型和技术如何在昇腾上快速的使能和体验,是昇腾开发者的 核心诉求。昇思MindSpore "海纳百川",全面融入主流生态,全面优化训练与推理全流程开发体验,让 开发者用极小成本完成SOTA大模型的迁移 ,昇思 Mind Spore 需攻克两大关键挑战: 1. 迁得快:让三方框架模型 "零成本"迁移,避免重复造轮子,同时模型精度完全对齐。 02 支持推理一键部署,分钟级拉起模型服务 在推理部署方面,借助 vLLM-MindSpore插件实现HuggingFace模型半小时部署上线。 面对千亿参数模 型,昇思 ...
华为昇腾万卡集群揭秘:如何驯服AI算力「巨兽」?
雷峰网· 2025-06-09 13:37
万卡集群可用度达到98%,集群秒级快恢(训练+推理)。 编辑丨李希 01 引言 你是否注意到,现在的 AI 越来越 "聪明" 了?能写小说、做翻译、甚至帮医生看 CT 片,这些能力背后离 不开一个默默工作的 "超级大脑工厂"——AI 算力集群。随着人工智能从简单规则判断进化到能处理万亿参 数的大模型,单台计算机的算力就像小舢板面对汪洋大海,而算力集群则是把上万台甚至几十万台计算机 像搭积木一样连接起来,形成一艘能承载巨量计算任务的 "算力航空母舰"。 当我们把上万台计算机整合成一个有机整体时,需要解决一系列世界级难题:如何让它们像精密钟表一样 协同工作?如何在部分设备故障时依然保持高效运行?如何快速修复大规模训练中的中断问题?接下来我 们将逐一揭秘这些支撑 AI 算力集群的关键特性,看看华为团队如何用工程智慧驯服这头算力巨兽。 02 超节点高可用: 24 小时不停工的智能工厂 就像医院的急诊系统必须时刻在线, AI 训练和推理也不能轻易中断。算力集群里每台计算机都有 "备用替 身",当某台机器出现故障(比如突然断电或硬件损坏),系统会立刻启动备用机接管任务,就像接力赛中 接力棒无缝传递,确保自动驾驶训练、语音 ...
华为如何驯服AI算力「巨兽」?
虎嗅APP· 2025-06-09 12:54
HUAWEI X HUXIU 在通往通用人工智能(AGI)的路上,如何像其他领域一样实现弯道超车,是业界绕不开的 话题。 在过去的十余年时间里,各项单点技术飞速演进,但随着单点技术演进的边际效应递减和系 统复杂度的提升,系统性能的天花板逐步从单点技术的上限演变成系统工程上限:单点优势 越来越像是精致的零件,提升空间有限;但采用系统工程创新,各个部分完美配合、高效协 同,实现整个系统的效能最优,才有更积极的现实意义。 如何在发挥单点技术优势的同时,以整体视角重新构建路径,通过对复杂系统的极致把控与 再组织、找到新的突破可能?解决这个看似不可能的问题,就有望为我们独立引领最前沿技 术发展创造条件。 近期,虎嗅将推出《华为技术披露集》系列内容,通过一系列技术报告,首次全面详述相关 技术细节,为业界提供参考价值。 我们期待通过本系列内容,携手更多伙伴共同构建开放协作的生态系统,助力昇腾生态在中 国的蓬勃发展。 《华为技术披露集》系列 VOL.13 :万卡集群 你是否注意到,现在的 AI 越来越 "聪明" 了?能写小说、做翻译、甚至帮医生看 CT 片,这 些能力背后离不开一个默默工作的 "超级大脑工厂"——AI 算力集 ...
让算力航母稳健远航,华为首次披露昇腾算力基础设施的压舱石
21世纪经济报道· 2025-06-09 12:08
( 3 ) Sim2Av a il abilit y高可用建模仿真: 马尔科夫高可用建模仿真框架,通过离散时间步长 仿真,建模单步时长内的故障性能劣化影响与恢复耗时,模拟复杂系统训练任务中的故障场 景及运维响应,实现对训练过程性能表现与故障恢复状态的全周期监控仿真。 建模仿真:算力底座的"数字化风洞" 框架迁移:给模型跑车换更酷炫轮胎 总结与展望 你是否注意到,现在的 AI 越来越 "聪明" 了?能写小说、做翻译,甚至帮医生看 CT 片,这些能 力背后离不开一个默默工作的 "超级大脑工厂"——AI 算力集群。随着人工智能从简单规则判断 进化到能处理万亿参数的大模型,单台计算机的算力就像小舢板面对汪洋大海,而算力集群则是 把上万台甚至几十万台计算机像搭积木一样连接起来,形成一艘能承载巨量计算任务的 "算力航 空母舰"。 当我们把上万台计算机整合成一个有机整体时,需要解决一系列世界级难题:如何让它们像 精密钟表一样协同工作?如何在部分设备故障时依然保持高效运行?如何快速修复大规模训 练中的中断问题?接下来我们将逐一揭秘这些支撑 AI 算力集群的关键特性,看看华为团队如 何用工程智慧驯服这头算力巨兽。 超节点高可用 ...