智谱新模型也用DeepSeek的MLA,苹果M5就能跑
量子位·2026-01-20 04:17

梦晨 发自 凹非寺 量子位 | 公众号 QbitAI 智谱AI上市后,再发新成果。 开源轻量级大语言模型GLM-4.7-Flash,直接替代前代GLM-4.5-Flash,API免费开放调用。 这是一个30B总参数、仅3B激活参数的混合专家(MoE)架构模型,官方给它的定位是"本地编程与智能体助手"。 在SWE-bench Verified代码修复测试中,GLM-4.7-Flash拿下59.2分,"人类最后的考试"等评测中也显著超越同规模的Qwen3-30B和GPT- OSS-20B。 作为去年12月发布的旗舰模型GLM-4.7的轻量化版本,GLM-4.7-Flash继承了GLM-4系列在编码和推理上的核心能力,同时针对效率做了专 门优化。 除了编程,官方还推荐将这个模型用于创意写作、翻译、长上下文任务,甚至角色扮演场景。 30B参数只激活3B,MLA架构首次上线 GLM-4.7-Flash沿用了该系列的"混合思考模型"的设计。 总参数量300亿,但实际推理时仅激活约30亿参数,使模型在保持能力的同时大幅降低计算开销。 上下文窗口支持到200K,既可以云端API调用,也支持本地部署。 目前官方还没有给出技术报 ...