沉寂一个月,openPangu性能飙升8%!华为1B开源模型来了
机器之心·2025-09-05 04:31
机器之心发布 为了破解这一痛点,华为近日发布了 专为昇腾端侧硬件打造的高性能语言模型 ——openPangu Embedded-1B 。该模型虽然只有 10 亿参数,却通过软硬件协同设 计显著降低推理延迟、提升资源利用率,并采用多阶段训练策略(包括从零预训练、课程学习式微调、离线 On-Policy 蒸馏、多源奖励强化学习)大幅增强各类任 务表现。 得益于多阶段训练与优化,openPangu Embedded-1B 在十亿参数的体量下实现了性能与效率的高度协同,成功将强大的大模型能力带到了端侧设备上,树立了「小 模型大能力」的新标杆。 评测成绩说明了一切,openPangu Embedded-1B 在多个权威基准上表现亮眼, 创下了 10 亿参数级别模型的全新 SOTA 纪录 。 模型的 整体平均分达到 63.90 ,不仅全面领先同类模型,甚至持平更大规模的 Qwen3-1.7B(63.69),充分体现了出色的参数效率。这表明,先进的训练与对齐方 法可以比单纯扩大模型规模更具成效。 机器之心编辑部 在端侧 AI 这个热门赛道,华为盘古大模型扔下了一颗 " 重磅炸弹" 。 如今,云端大模型已经能侃侃而谈、答疑解 ...