Workflow
理想提出首个包含自车和他车轨迹的世界模型
LI AUTOLI AUTO(US:LI) 理想TOP2·2025-11-23 11:56

理想的世界模型包含自车和其他车的轨迹,这是理想首次提出的。 做这件事目的是为了能够让理想VLA在仿真环境里进行强化学习,同一个场景可以不断测试更优的轨迹路线,这是真实数据完全无法实现的。 可视化见下面这个视频: 理想VLA训练过程: 预训练阶段是在云端训一个32B的VL基座模型,包含3D视觉、比开源模型清晰度提升3-5倍的高清2D视觉、驾驶相关的language的语料,关键的 VL联合语料(如导航信息与人类判断的同步记录),为适配车端算力并保证推理速度,云端大模型蒸馏成3.2B的MoE模型。 后训练阶段是将action引入模型,使其转化为VLA,参数量接近4B,采用短链条CoT,限制在2-3步以内,再用difusion,对未来4-8秒的轨迹和 环境进行预测。 强化学习阶段为两部分,一是人类反馈强化学习,二是不依赖人类反馈,利用世界模型模型生成数据进行纯强化学习训练,基于舒适性(G值)、 无碰撞、遵守交规三大指标自我进化,目标是驾驶水平超越人类。 2025年3月12日理想发布 Other Vehicle Trajectories Are Also Needed: A Driving World Model Un ...