扩散模型加速
Search documents
NeurIPS 2025 Spotlight | 中国联通以全局优化重塑扩散模型加速
机器之心· 2025-11-26 01:36
作者和团队介绍:本文一作是高焕霖和陈平,通讯作者为赵放和廉士国,其他作者还包括石芙源、谭超、 刘兆祥、王恺,所有作者均来自联通数据智能有限公司(联通数据科学与人工智能研究院)元景大模型研 发团队。 当前,视频生成模型性能正在快速提升,尤其是基于Transformer架构的DiT模型,在视频生成领域的表现已 经逐渐接近真实拍摄效果。然而,这些扩散模型也面临一个共同的瓶颈: 推理时间长、算力成本高、生成 速度难以提升 。随着视频生成长度持续增加、分辨率不断提高,这个瓶颈正在成为影响视频创作体验的主 要障碍之一。 来自 中国联通数据科学与人工智能研究院 的研究团队提出了一个全新的思路 : LeMiCa(Lexicographic Minimax Path Caching) —— 一种无需训练、全局最优建模的缓存加速框架, 能在保持画质与一致性的同 时,实现高效的推理加速。LeMiCa解决的是一个长期被"局部贪心决策"束缚的老问题: 扩散模型是否存在 一种真正"全局一致、误差可控、速度极快"的缓存加速路径? 研究答案是:有。并且比想象中简单得多。 这项研究已经成功入选 NeurIPS 2025 Spotlight。 ...
ACM MM 2025 | 小红书AIGC团队提出风格迁移加速算法STD
机器之心· 2025-08-04 07:05
本论文主要作者来自小红书 AIGC 团队(Dynamic-X-Lab),Dynamic‑X‑LAB 是一个专注于 AIGC 领域的研究团队,致力于推动姿态驱动的人像生成与视频动画 技术。他们以高质量、高可控性的生成模型为核心,围绕文生图(t2i)、图像生成(i2i)、图像转视频(i2v)和风格迁移加速等方向展开研究,并通过完整的开 源方案分享给开发者与研究者社区。 基于一致性模型(Consistency Models, CMs)的轨迹蒸馏(Trajectory Distillation)为加速扩散模型提供了一个有效框架,通过减少推理步骤来提升效率。然而,现 有的一致性模型在风格化任务中会削弱风格相似性,并损害美学质量 —— 尤其是在处理从部分加噪输入开始去噪的图像到图像(image-to-image)或视频到视频 (video-to-video)变换任务时问题尤为明显。 这一核心问题源于当前方法要求学生模型的概率流常微分方程(PF-ODE)轨迹在初始步骤与其不完美的教师模型对齐。这种仅限初始步骤对齐的策略无法保证整 个轨迹的一致性,从而影响了生成结果的整体质量。 为了解决这一问题,文章提出了 单轨 迹 蒸馏( ...