人民大学提出的扩散语言模型,可能要改写历史...
自动驾驶之心·2025-12-12 03:02

作者 | 李崇轩 编辑 | 自动驾驶之心 原文链接: https://www.zhihu.com/question/1908479621466396378/answer/1910672718174589774 点击下方 卡片 ,关注" 自动驾驶之心 "公众号 戳我-> 领取 自动驾驶近30个 方向 学习 路线 >>自动驾驶前沿信息获取 → 自动驾驶之心知识星球 本文只做学术分享,如有侵权,联系删文 大家好,我是中国人民大学高瓴人工智能学院李崇轩,因为做的非常相关,来回答一下这个问题。 我在连续扩散模型和朱军老师以及师弟师妹们有很多合作,代表性工作有 Analytic-DPM,U-ViT, DPM-Solver,ProlificDreamer,DPM-Solver++,unidiffuser 等 等。 我在人大的课题组很年轻,组内在离散扩散模型的代表性工作有 RADD,Scaling Law for MDM,LLaDA,LLaDA-V 和这两天即将发布的 LLaDA 1.5。 我想可以按照时间划分为两个阶段来介绍一下这个领域,然后发表一下我的看法。 第一阶段:2022-2024年底,扩散语言模型偏基础研究的阶段 ...