Workflow
GenVE
icon
Search documents
智象未来两项研究入选ICCV 2025,发布两项视觉生成突破性成果
Ge Long Hui· 2025-07-18 02:54
近日,智象未来团队两项创新成果入选ICCV 2025,分别聚焦于图像生成与视频增强两个方向,全面展 示了其在生成式AI技术上的突破与领先。 这两项成果分别发表于ICCV 2025 论文《Denoising Token Prediction in Masked Autoregressive Models》 和《Aligning Global Semantics and Local Textures in Generative Video Enhancement》,为视觉生成技术开 辟新路径,推动高质量、高效率的多模态内容生成迈向实用化,未来有望在创意设计、影视制作等领域 广泛应用。 在视频增强方面,团队则推出了创新的生成式视频画质增强框架GenVE,攻克传统方法细节缺失难题。 其核心在于双重对齐机制:通过图像扩散模型生成语义参考,确保全局布局一致;借助局部感知交叉注 意力模块,精准迁移参考图像的纹理细节至视频。同时,多重增强策略提升模型鲁棒性:噪声增强平衡 质量与保真度,时间增强强化帧间连贯性,掩码策略提升特征利用率。在YouHQ40、VideoLQ等数据集 上,GenVE的MUSIQ、DOVER等指标全面领先 ...