Workflow
MoVieDrive
icon
Search documents
超越一众SOTA!华为MoVieDrive:自动驾驶环视多模态场景生成最新世界模型~
自动驾驶之心· 2025-08-24 23:32
点击下方 卡片 ,关注" 自动驾驶之心 "公众号 戳我-> 领取 自动驾驶近30个 方向 学习 路线 今天自动驾驶之心为大家分享 华为诺亚和多伦多大学最新的工作— MoVieDrive ! 自动驾驶环视多模态场景生成最新算法,超越 CogVideoX等一众SOTA。 如果您有相关工作需要分享,请在文末联系我们! 自动驾驶课程学习与技术交流群加入,也欢迎添加小助理微信AIDriver005做进一步咨询 >>自动驾驶前沿信息获取 → 自动驾驶之心知识星球 论文作者 | Guile Wu等 编辑 | 自动驾驶之心 写在前面 & 笔者的个人理解 近年来,视频生成在自动驾驶领域的城市场景合成中展现出优越性。现有的自动驾驶视频生成方法主要集中在RGB视频生成上,缺乏支持多模态视频生成的能力。 然而多模态数据(如深度图和语义图)对于自动驾驶中的整体城市场景理解至关重要。虽然可以使用多个模型来生成不同的模态,但这会增加模型部署的难度,并 且无法利用多模态数据生成的互补线索。为了解决这个问题,本文提出了一种全新的面向自动驾驶的多模态环视视频生成方法。具体而言,我们构建了一个由 模 态共享组件 和 模态特定组件 组成的统一扩散T ...