Waymo提出Drive&Gen：用生成视频评估端到端自动驾驶（IROS'25）

作者 | Jiahao Wang 来源 | 我爱计算机视觉传统的自动驾驶系统像一个部门林立的大公司，感知、预测、规划等模块各司其职，虽然稳定，但流程繁琐，一个环节出错就可能影响全局。而E2E模型就像一个全能的创业团队，直接从摄像头画面等原始输入，一步到位输出驾驶决策，简洁高效，潜力巨大。但问题也随之而来：AI生成的视频真的足够"真实"，能骗过自动驾驶系统，并用来做严肃的评估吗？我们又该如何深入了解E2E驾驶模型的"脾气"，修复它的短板，让它在没见过的新场景（比如突然的暴雨天）里也能从容应对？为了回答这些问题，来自约翰霍普金斯大学、Waymo和谷歌DeepMind的研究者们联手，在即将于IROS 2025会议上发表的论文中，提出了一个名为 Drive&Gen 的新框架。这个名字很直白，就是将驾驶（Drive）和生成（Gen）结合起来，旨在连接E2E驾驶模型和生成式世界模型，共同评估和提升彼此。背景：当E2E驾驶遇上生成式AI 点击下方卡片，关注" 自动驾驶之心 "公众号戳我-> 领取自动驾驶近30个方向学习路线 >>自动驾驶前沿信息获取 → 自动驾驶之心知识星球本文只做学术 ...