Workflow
9位顶级研究员连讲3晚,华为盘古大模型底层研究大揭秘
机器之心·2025-05-26 10:59

近年来,大语言模型(LLMs)在自然语言处理、代码生成、多模态理解等领域发展迅速,已成为通用人工 智能系统的重要基石。 19:00-19:40 然而,模型能力的提升伴随着计算资源与存储需求的急剧增长,如何实现高性能与高效率并存,已成为 AI 面临的重要挑战。 作为 AI 领域的先行者, 华为诺亚方舟实验室 正在用前沿研究给出答案。 今年 4 月,该团队成功开发出基于昇腾算力训练的千亿级通用语言大模型 Pangu Ultra。在多个领域和评测 上超越之前 Llama 405B 和 Mistral Large 2 等密集模型,并可以与 DeepSeek-R1 等更大规模的稀疏模型一较 高下。 5 月初,他们又推出了稀疏大语言模型 Pangu Ultra MoE,并且实现了在 6000 + 块昇腾 NPU 上对 MoE 模型 的长期稳定训练。 想了解更多关于该团队在大模型方面的技术积累与研究成果? 5 月 28 日至 30 日,每晚 19:00 至 21:00,机器之心联合 华为诺亚方舟实验室举办系列分享会,带来包括量 化、剪枝、MoE 架构优化、KV 优化等多个关键技术方向的最新突破。 三晚连播,干货密集,值得每 ...