Workflow
Imitation Learning (IL)
icon
Search documents
地平线RAD:基于3DGS 大规模强化学习的端到端驾驶策略
自动驾驶之心· 2025-11-29 02:06
作者 | SPiriT 编辑 | 自动驾驶之心 原文链接: https://zhuanlan.zhihu.com/p/1888242399811175395 点击下方 卡片 ,关注" 自动驾驶之心 "公众号 戳我-> 领取 自动驾驶近30个 方向 学习 路线 >>自动驾驶前沿信息获取 → 自动驾驶之心知识星球 本文只做学术分享,如有侵权,联系删文 原文信息: https://hgao-cv.github.io/RAD/ TLDR il :imitation learning ; rl:reinforcement learning 做了什么? 第一个提出基于 3dgs 来进行 rl 用来做 e2e policy。分以下三步走: 有啥提升? 主要是碰撞率相比纯 il 少了 3 倍 有啥局限? 3dgs-env缺乏交互,只是log replay;3dgs 渲染非刚性行人、视野外信息、低光场景等效果不行 个人总结 总体来说,读起来不费劲,行文舒服、图文清楚、实验充分,有很实际的工程化改进。核心亮点是使用 3dgs 来构建 sensor-level 的 env,最后结果确实比 il 的方案 要好一些。 工程化改进较多, ...