“全球大模型第一股” 公开技术细节
Shang Hai Zheng Quan Bao·2026-02-23 05:39

2月22日,智谱发布技术报告,全面解读GLM-5的技术细节。 从技术导向而言,此前AI编程范式属于"Vibe Coding"(氛围编程),即程序员手动提示AI生成代码,较为依赖人力,效率有瓶颈。 GLM-5瞄准的是Agentic Engineering(智能体工程),要求AI不再只是辅助工具,而是一个可以自主规划、执行、迭代的"虚拟工程 师"。 得益于此,智谱将模型参数规模扩展至744B(7440亿),同时将训练token规模提升至28.5T(28.5万亿)。 第二,更快的"学习"方式。GLM-5构建并完善了一套名为"slime"的异步强化学习基础设施,这是其训练效率取得突破的核心。传统的 强化学习训练效率相对较低,slime将"生成任务轨迹"和"模型参数更新"解耦,即将这两个过程分开后同时进行。这就像一边让AI在实 践中不断尝试,一边后台同步总结经验教训,极大提升了训练效率。 第三,更聪明的"决策"算法。GLM-5提出了全新的异步Agent RL算法。这一算法针对动态环境下的规划与自我纠错能力进行了深度优 化,这使得模型能够从海量的、多步骤的交互中持续学习,优化其在动态环境中的规划、执行和自我纠错能力。 第 ...