Workflow
DriveLaW
icon
Search documents
帝国理工VLA综述:从世界模型到VLA,如何重构自动驾驶(T-ITS)
自动驾驶之心· 2026-01-05 00:35
点击下方 卡片 ,关注" 自动驾驶之心 "公众号 戳我-> 领取 自动驾驶近30个 方向 学习 路线 该工作系统性地复盘了截止 2025年9月 的 77篇 前沿论文,从 端到端 VLA 、 世界模型 、 模块化集成 三大维 度,为开发者提供了一份详尽的"大模型上车"学习路线图。 核心看点:读懂世界模型与VLA的演进 本综述精准切中了当前自动驾驶社区最关心的三大技术命题,构建了清晰的技术象限。 图1:自动驾驶大模型技术架构图谱(涵盖模块化、端到端、数据生成及平台四大核心领域) 1. 端到端集成的终局:VLA (Vision-Language-Action) 论文作者 | Hanlin Tian, Kethan Reddy, Yuxiang Feng, Mohammed Quddus, Yiannis Demiris, Panagiotis Angeloudis 单位 | 帝国理工学院 (Imperial College London) 最近, DriveLaW 、 OpenDriveVLA 等架构的提出,标志着自动驾驶正在从"感知-规划"分离走向 VLA (Vision-Language-Action) 的端到 ...
超越DriveVLA-W0!DriveLaW:世界模型表征一统生成与规划(华科&小米)
自动驾驶之心· 2026-01-04 01:04
点击下方 卡片 ,关注" 自动驾驶之心 "公众号 戳我-> 领取 自动驾驶近30个 方向 学习 路线 >>自动驾驶前沿信息获取 → 自动驾驶之心知识星球 论文作者 | Tianze Xia等 编辑 | 自动驾驶之心 近年来,得益于感知(如 BEVFormer, MapTR, BEVDet 等)和规划(如 UniAD, VAD, DiffusionDrive, ReCogDrive 等)的突破性进展,自动驾驶技术取得了长足进步。 然而,现有系统在面对 长尾场景 时依然显得脆弱,严重制约了闭环驾驶的性能。为了解决这一难题,近期大量研究工作尝试运用 世界模型(World Models) ,旨在 通过预测驾驶场景的未来演变来增强系统的泛化性与鲁棒性来解决长尾问题。 目前,世界模型在自动驾驶中的应用已百花齐放:一类致力于合成下游任务数据以应对罕见场景(如 VISTA, GAIA, MagicDrive, DriveDreamer, DrivingDiffusion);另 一类利用模拟环境进行策略学习(如 RAD, ReSim, OmniNWM);还有一类则提供未来的视觉预测作为辅助监督信号(如 DriveVLA, Dr ...