智谱发布GLM-5技术报告 披露其实现性能大幅跃升的技术细节

本报讯 (记者梁傲男)2月22日,北京智谱华章科技股份有限公司(以下简称"智谱",股票代 码"HK2513")发布了最新一代基础模型GLM-5的技术报告,披露了GLM-5实现性能大幅跃升的技术细 节。 智谱在报告中表示,GLM-5是一款旨在推动编程范式从"VibeCoding"(氛围编程)转 向"AgenticEngineering"(智能体工程)的下一代基础模型。GLM-5在前代模型GLM-4.5的智能体、推理 与编程能力基础上,采用稀疏注意力以大幅降低推理成本,同时保持长上下文能力无损。为了让模型更 好地与各类任务对齐,智谱构建了一套新型异步强化学习(RL)基础设施,通过将生成过程与训练过 程解耦,从而大幅提升了后训练的迭代效率。 总体而言,GLM-5能够实现性能的大幅跃升,主要得益于以下四大技术创新: 第一,引入DSA稀疏注意力机制。这一全新架构极大降低了训练与推理成本。此前的GLM-4.5依赖标准 MoE架构提升效率,而DSA机制则使GLM-5能够根据Token的重要性动态分配注意力资源。在不折损长 上下文理解和推理深度的前提下,算力开销得以大幅削减。得益于此,模型参数规模成功扩展至744B (744 ...