Latent Forcing
Search documents
李飞飞团队新作:简单调整生成顺序,大幅提升像素级图像生成质量
量子位· 2026-02-14 10:09
闻乐 发自 凹非寺 量子位 | 公众号 QbitAI 长期以来,AI生图被一个经典矛盾困扰。 潜空间模型效率高,但细节有损耗;像素空间模型保真度高,却容易结构混乱、速度慢。 要么快要没准,大家几乎默认这是架构带来的取舍问题,没法彻底解决。 但扩散模型生图,顺序真的对吗? 李飞飞团队最新论文提出的 Latent Forcing 方法直接打破了这一共识,他们发现 生成的质量瓶颈不在架构,而在顺序 。 简单说就像画画必须先打草稿再填色,AI也需要一个「先定结构、后填细节」的强制逻辑。 Latent Forcing仅通过重排生成轨迹,像素扩散模型不仅找回了效率,更在多项指标上刷新SOTA。 传统方法瓶颈 在深入了解Latent Forcing之前,咱先来说说当前两大方法的瓶颈。 传统像素级扩散模型之所以画图会画歪,是因为它在降噪过程中,高频的纹理细节往往会干扰低频的语义结构。 模型常常在还没搞清楚物体的整体轮廓时,就被迫去预测局部的像素颜色,其实这在本质上就违背了视觉生成的自然逻辑。 于是李飞飞团队思考—— 能不能既保留像素级的无损精度,又获得潜空间的结构引导? 先打个草稿 Latent Forcing的答案是—— ...