MoVieDrive - filings, earnings calls, financial reports, news - Reportify

MoVieDrive

Search documents

超越一众SOTA！华为MoVieDrive：自动驾驶环视多模态场景生成最新世界模型~

自动驾驶之心· 2025-08-24 23:32

点击下方卡片，关注" 自动驾驶之心 "公众号戳我-> 领取自动驾驶近30个方向学习路线今天自动驾驶之心为大家分享华为诺亚和多伦多大学最新的工作— MoVieDrive ！自动驾驶环视多模态场景生成最新算法，超越 CogVideoX等一众SOTA。如果您有相关工作需要分享，请在文末联系我们！自动驾驶课程学习与技术交流群加入，也欢迎添加小助理微信AIDriver005做进一步咨询 >>自动驾驶前沿信息获取 → 自动驾驶之心知识星球论文作者 | Guile Wu等编辑 | 自动驾驶之心写在前面 & 笔者的个人理解近年来，视频生成在自动驾驶领域的城市场景合成中展现出优越性。现有的自动驾驶视频生成方法主要集中在RGB视频生成上，缺乏支持多模态视频生成的能力。然而多模态数据（如深度图和语义图）对于自动驾驶中的整体城市场景理解至关重要。虽然可以使用多个模型来生成不同的模态，但这会增加模型部署的难度，并且无法利用多模态数据生成的互补线索。为了解决这个问题，本文提出了一种全新的面向自动驾驶的多模态环视视频生成方法。具体而言，我们构建了一个由模态共享组件和模态特定组件组成的统一扩散T ...

多模态多视角视频生成

扩散Transformer模型

多模态多视角视频生成

扩散Transformer模型