华为发布业界首个扩散语言模型Agent,部分场景提速8倍!
Xin Lang Cai Jing·2026-02-10 06:44

允中 发自 凹非寺 量子位 | 公众号 QbitAI 大模型通往现实世界的"最后三公里",Agent已然成为最具代表性的入场券。 但当下的共识发生了微妙的变化: 衡量一个Agent够不够强,早已不再看它能不能"答对问题",而是看它在面对多轮推理、工具调用及复杂协作时,能否用最短的路径、最少的交互预算, 稳定地搞定任务。 在这一背景下,一个长期被行业忽视的底层命题浮出水面: 当Agent的框架、工具、数据和训练方式都保持一致时,仅仅改变语言模型的生成范式(Autoregressive vs Diffusion),是否会系统性地改变 Agent的规划与行为模式? 近日,来自华为诺亚方舟实验室、华为先进计算与存储实验室、UCL、南洋理工大学、清华大学和北京大学的研究团队,在最新工作《DLLM Agent: See Farther, Run Faster》中,对这一问题给出了迄今为止最"对照实验式"的回答。 他们发现,仅仅是把"底座"换成了扩散式大模型(DLLM),Agent就像突然开了"上帝视角",执行速度不仅提升了30%以上,甚至在部分复杂任务中跑出 了8倍于传统AR模型的效率。 文章链接:https://arx ...