Diffusion 模型

Search documents
ICCV2025 | 多视图生成新范式-利用自回归模型探索多视图生成
机器之心· 2025-07-12 02:11
推理代码、权重、渲染的 GSO 及其配套的 Prompt 已全部开源。 背景与动机 根据人工指令生成多视图图像对于 3D 内容创作至关重要。主要挑战在于如何在多视图之间保持一致性,以及如何在不同条件下有效地合成形状和纹理。此前的工 作主要使用 Diffusion 模型中自带的多视角一致性先验,促进多视角一致图像生成。但是 Diffusion 模型存在一些先天劣势: 论文地址: https://arxiv.org/pdf/2506.18527 代码地址: https://github.com/MILab-PKU/MVAR/ 绝大多数 Diffusion 模型同时多个视角; 单一 Diffusion 模型难以接受多模态控制条件; 本文第一作者包括北京大学博士生胡珈魁与清华大学硕士生杨羽霄;通讯作者为北京大学助理教授卢闫晔与(前)百度视觉技术部刘家伦。 本文介绍并开发了一种自回归生成多视图图像的方法 MVAR 。其目的是确保在生成当前视图的过程中,模型能够从所有先前的视图中提取有效的引导信息,从而 增强多视图的一致性。 MVAR 拉近了纯自回归方法与最先进的基于扩散的多视图图像生成方法的生成图像质量,并成为能够处理 ...