视觉语言轨迹预训练

Search documents
CVPR2025 WAD纯视觉端到端 | 冠军方案技术报告~
自动驾驶之心· 2025-06-29 11:33
作者 | Zh.ai 编辑 | 自动驾驶之心 原文链接: https://zhuanlan.zhihu.com/p/1920858767987308475 点击下方 卡片 ,关注" 自动驾驶之心 "公众号 戳我-> 领取 自动驾驶近15个 方向 学习 路线 >>自动驾驶前沿信息获取 → 自动驾驶之心知识星球 本文只做学术分享,如有侵权,联系删文 WAD前五名 纯视觉端到端驾驶比赛前五名,第一名Poutine(截至2025.6.25) 技术报告: 比赛第一名方案: Poutine Vision-Language-Trajectory Pre-Training and Reinforcement Learning Post-Training Enable Robust End- to-End Autonomous Driving 技术摘要: 1. 主体是3B参数VLM,解决视觉端到端自动驾驶长尾场景; 大模型预刷生产annotations 2. 两阶段训练: 技术方案: a. 阶段一预训练。自监督,vision- language- trajectory,next-token prediction方式,训练数据8 ...