拆解理想在世界模型方向的工作
自动驾驶之心·2026-01-05 09:30

ICCV2025中稿的Hierarchy UGP,自动驾驶场景重建。 具有时空一致性的多风格自动驾驶场景生成算法StyledStreets。 整合多模态驾驶意图与潜在世界模型实现合理规划的World4Drive,中稿ICCV 2025。 自动驾驶的视频生成扩散世界模型GeoDrive。 统一生成视觉与lidar的自驾世界模型框架OmniGen,中稿ACMMM2025。 结合强化学习的自动驾驶视频生成世界模型RLGF,中稿NeurIPS 2025。 利用稀疏注意力实现4D OCC世界模型预测算法 SparseWorld-TC。 世界模型端到端闭环强化学习框架AD-R1。 最近在复盘各家如何使用世界模型的,今天和大家盘一下理想在这方面的工作。理想对世界模型的定义在 重建+生成 ,利用重建技术(3DGS)建模自动驾驶场 景,再利用生成方法实现闭环仿真或者场景生成。 这里面核心的技术是3DGS和生成。 整体上来看,世界模型是围绕视频为核心搭建的时空认知系统 ,这一点也和蔚来任少卿的观点一致。通过跨模态的互相预测和重建,促使系统学习时空和物理规 律,让机器能像人一样理解环境。 通过重建+生成,既可以做云端的数据生成,也 ...