SDAR范式
Search documents
上海AI Lab发布混合扩散语言模型SDAR:首个突破6600 tgs的开源扩散语言模型
机器之心· 2025-11-01 04:22
近日,上海人工智能实验室针对该难题提出全新范式 SDAR (Synergistic Diffusion-AutoRegression)。 程爽,上海人工智能实验室和浙江大学联培博士生一年级;卞一涵,美国马里兰大学硕士生二年级,上海人工智能实验室实习生;刘大卫,上海人工智能实验室 和上海交通大学联培博士生一年级 ;齐弼卿,上海人工智能实验室研究员(指导老师) 大模型推理速度慢、成本高,已成为限制其广泛应用的核心 瓶颈 。其根源在于自回归(AR)模型「逐字生成」 的串行模式。 该方法通过 「训练-推理解耦」的巧妙设计,无缝融合了 AR 模型 的高性能与扩散模型的并行推理优势,能以极低成本将任意 AR 模型 「改造」为并行解码模型。 论文标题:SDAR: A Synergistic Diffusion-AutoRegression Paradigm for Scalable Sequence Generation 实验证明, SDAR 不仅 在多个基准上与原版 AR 模型 性能持平甚至超越,还能带来数倍的真实推理加速。更令人惊喜的是, SDAR 在复杂的科学推理任务上展现 出巨大潜力。在与采用相同配置训练的 AR ...