大道至简,何恺明团队新作pMF开启像素级「无潜、单步」生成范式
机器之心·2026-02-03 14:22

机器之心编辑部 何恺明团队新论文,再次「大道至简」。 此次研究直指当前以 DiT 为代表的主流扩散模型与流匹配模型存在的通病,并 提出了一种用于单步、无潜空间(Latent-free)的图像生成新框架 。 在生成式 AI 领域,追求更高效、更直接的生成范式一直是学界的核心目标。 当前,以 DiT 为代表的主流扩散模型与流匹配模型主要依赖两大支柱来降低生成难度,一是通过多步采样将复杂的分布转换分解为微小的步进,二是在预训练 VAE(变分自编码器)的潜空间中运行以降低计算维度。 尽管这些设计在图像质量上取得了巨大成功,但从深度学习「端到端」的精神来看,这种对多步迭代和预置编码器的依赖,无疑增加了系统的复杂性和推理开 销。 面对这些挑战, 何恺明团队提出了用于单步、无潜空间图像生成的 pixel MeanFlow(pMF)框架 。该框架继承了改进均值流(improved MeanFlow,MF)的思 路,通过在瞬时速度(即 v)空间内定义损失函数,来学习平均速度场(即 u)。 与此同时,受 Just image Transformers(JiT)的启发,pMF 直接对类似于去噪图像的物理量(即 x-predicti ...