Workflow
去噪扩散桥模型
icon
Search documents
ICLR 2025 | 无需训练加速20倍,清华朱军组提出用于图像翻译的扩散桥模型推理算法DBIM
机器之心· 2025-04-27 10:40
论文有两位共同一作。郑凯文为清华大学计算机系三年级博士生,何冠德为德州大学奥斯汀分校(UT Austin)一年级博士生。 扩散模型(Diffusion Models)近年来在生成任务上取得了突破性的进展,不仅在图像生成、视频合成、语音合成等领域都实现了卓越表现,推动了文本到图像、 视频生成的技术革新。然而,标准扩散模型的设计通常只适用于从随机噪声生成数据的任务,对于图像翻译或图像修复这类明确给定输入和输出之间映射关系的 任务并不适合。 为了解决这一问题,一种名为 去噪扩散桥模型 (Denoising Diffusion Bridge Models, DDBMs)的变种应运而生。DDBM 能够建模两个给定分布之间的桥接过程, 从而很好地应用于图像翻译、图像修复等任务。然而,这类模型在数学形式上依赖 复杂的常微分方程 / 随机微分方程 ,在生成高分辨率图像时通常需要 数百步的 迭代 , 计算效率低下 ,严重限制了其在实际中的广泛应用。 相比于标准扩散模型,扩散桥模型的推理过程 额外涉及初始条件相关的线性组合和起始点的奇异性 ,无法直接应用标准扩散模型的推理算法。为此,清华大学朱 军团队提出了一种名为 扩散桥隐式模 ...