Workflow
华为全面揭秘超大规模MoE模型昇腾推理部署技术,国产芯片推理性能再创新高
雷峰网·2025-05-19 12:14

" 华为不只是「官宣」一下而已,后面更会是全面开源。 " 作者丨李希 推理部署,成为大模型落地重中之重 从 2017 年 Google 提出 Transformer —— 这一人工智能 中最常用的 神经网络架构,到 DeepSeek V3/R1 在 202 5 年 春节 一夜爆火,超大规模 MoE 架构大模型的重点逐渐从训练开发转向推理支撑的 应用落地。 推理场景是大模型认知能力的 " 试金石 " ,是大模型商业化落地的核心能力,从抢先上线 DeepSeek 模 型到 API 服务价格战,在推理为王的时代,谁能最极致的提升推理部署计算效率,谁才能真正获得大模型 商业成功。 数学补物理,极致提升计算效率 " 数学补物理 " ,通常指通过数学理论、算法和建模方法,弥补传统物理设备开发在复杂系统分析、大规 模计算或多场耦合问题中的局限性。华为轮值董事长孟晚舟曾在 2025 年新年致辞中提到: " 华为十多个实验室与伙伴们的工程师组成 " 大杂烩 " 团队,面对天成 AI 集群系统和单芯片性能的严峻 工程挑战,他们创造性应用数学补物理、非摩尔补摩尔、系统补单点等思想,在散热、供电、高速、高密 及大芯片在板可靠性等工程 ...