Workflow
端到端自动驾驶
icon
Search documents
当我们把端到端量产需要的能力展开后......
自动驾驶之心· 2026-01-08 09:07
点击下方 卡片 ,关注" 自动驾驶之心 "公众号 戳我-> 领取 自动驾驶近30个 方向 学习 路线 如果说现在自驾行业哪个职位最受欢迎,一定是端到端。 地平线HSD的成功,让业内开始重新审视一段式端到端的重要性。 智能驾驶不再重度依赖模块化感知和强规则兜底,而是直接感知环境,并生成动作序列。端到端 的能力极大地降低了系统复杂度,使自动驾驶车辆能够应对更加复杂的驾驶场景。 然而,在实际的落地应用中。只靠模仿学习是不够的,系统仍然面临轨迹不稳定等问题。其核心原因在于模型缺乏基于环境反馈的持续修正能力。 强化学习为端到端带来了新的解决思路。RL并不是一门新的学科,但RL的优势为端到端提供了从"模仿"走向"优化"的关键机制。通过引入奖励或价值信号,RL可 以在保持端到端能力的同时,对动作策略进行闭环优化,弥补模仿学习在分布外状态和误差累积上的不足。 纯模仿学习的端到端,本质是在"复制数据分布"。RL提供的是闭环优化能力:用环境反馈修正动作,用value/reward信号约束轨迹行为。 目前工业界头部的公司已经形成了一套完整的模型迭代思路, 模仿学习训练→闭环强化学习→规则兜底(时空联合规划) ,此外还是涉及导航信息 ...
随到随学!端到端与VLA自动驾驶小班课(视频+答疑)
自动驾驶之心· 2026-01-08 05:58
Jason, C9本科+QS50 PhD,已发表CCF-A论文2篇,CCF-B论文若干。现任国内TOP主机厂算法专家,目前从事端到端、大模型、世界模型等前沿算法的 预研和量产,并已主持和完成多项自动驾驶感知和端到端算法的产品量产交付,拥有丰富的端到端算法研发和实战经验。 这门课程讲如何展开 第一章:端到端算法介绍 点击下方 卡片 ,关注" 自动驾驶之心 "公众号 戳我-> 领取 自动驾驶近30个 方向 学习 路线 端到端与VLA涉及的核心内容包括BEV感知、视觉语言模型VLM、扩散模型、强化学习等等。通过学习端到端与VLA自动驾驶,可以掌握学术界和工业 界最前沿的技术栈。 为此我们联合 工业界大佬 开展了这门《端到端与VLA自动驾驶小班课》正式结课啦,随到随学(视频+答疑)!课程包含二段式端到端与一段式端到端 前沿算法的细致讲解,基本上都是工业界和学术界的Baseline。 扫码报名!抢占课程名额 讲师介绍 第一章主要是针对端到端自动驾驶概括性的内容讲解,这一章老师会带大家盘一下端到端的发展历史,端到端这个概念是怎么来了,为什么从模块化的 方法发展到端到端。一段式、二段式再到现在的VLA范式,每一种范式都有哪 ...
英伟达开源Alpamayo系列模型,有望重塑端到端自动驾驶
Changjiang Securities· 2026-01-07 10:46
行业研究丨点评报告丨软件与服务 [Table_Title] 英伟达开源 Alpamayo 系列模型,有望重塑端到 端自动驾驶 报告要点 丨证券研究报告丨 [Table_Summary] 太平洋时间 2026 年 1 月 5 日,NVIDIA 发布 NVIDIA Alpamayo 系列开源 AI 模型、仿真工具及 数据集,旨在推动安全可靠的推理型辅助驾驶汽车开发。此次英伟达开源的 Alpamayo 系列模 型或将帮助开发者不断改进其自动驾驶汽车技术,进而加速高级版智能驾驶的商业化落地。智 能驾驶产业有望在新技术加持下加速规模化、商业化应用,进而惠及全产业链。建议关注:1) 智能驾驶相关硬件提供商;2)Robotaxi 等自动驾驶运营平台。 分析师及联系人 [Table_Author] 宗建树 陈耀文 SAC:S0490520030004 SAC:S0490525070002 SFC:BUX668 请阅读最后评级说明和重要声明 %% %% %% %% research.95579.com 1 软件与服务 cjzqdt11111 [Table_Title 英伟达开源2]Alpamayo 系列模型,有望重塑端 到端自 ...
拆解理想在世界模型方向的工作
自动驾驶之心· 2026-01-05 09:30
ICCV2025中稿的Hierarchy UGP,自动驾驶场景重建。 具有时空一致性的多风格自动驾驶场景生成算法StyledStreets。 整合多模态驾驶意图与潜在世界模型实现合理规划的World4Drive,中稿ICCV 2025。 自动驾驶的视频生成扩散世界模型GeoDrive。 统一生成视觉与lidar的自驾世界模型框架OmniGen,中稿ACMMM2025。 结合强化学习的自动驾驶视频生成世界模型RLGF,中稿NeurIPS 2025。 利用稀疏注意力实现4D OCC世界模型预测算法 SparseWorld-TC。 世界模型端到端闭环强化学习框架AD-R1。 最近在复盘各家如何使用世界模型的,今天和大家盘一下理想在这方面的工作。理想对世界模型的定义在 重建+生成 ,利用重建技术(3DGS)建模自动驾驶场 景,再利用生成方法实现闭环仿真或者场景生成。 这里面核心的技术是3DGS和生成。 整体上来看,世界模型是围绕视频为核心搭建的时空认知系统 ,这一点也和蔚来任少卿的观点一致。通过跨模态的互相预测和重建,促使系统学习时空和物理规 律,让机器能像人一样理解环境。 通过重建+生成,既可以做云端的数据生成,也 ...
AAAI 2026 | 小鹏联合北大,专为VLA模型定制视觉token剪枝方法
具身智能之心· 2026-01-05 01:03
实验结果显示, 在不同剪枝比例下,FastDriveVLA 在 nuScenes 开环规划基准测试中均取得了 SOTA 性能 。FastDriveVLA 也非常高效,当视觉 token 数量从 3249 减少至 812 时,FastDriveVLA 的 FLOPs 直降约 7.5 倍;在 CUDA 推理延迟方面,FastDriveVLA 将预填充(prefill)时间减少了 3.7 倍、将解码(decode)时间减少 了 1.3 倍,显著提升了推理效率。 该篇论文被 AAAI 2026 录用。 编辑丨机器之心 点击下方 卡片 ,关注" 具身智能之心 "公众号 >> 点击进入→ 具身 智能之心 技术交流群 更多干货,欢迎加入国内首个具身智能全栈学习社区: 具身智能之心知识星球(戳我) ,这里包含所有你想要的! VLA 模型正被越来越多地应用于端到端自动驾驶系统中。然而,VLA 模型中冗长的视觉 token 极大地增加了计算成本。但现有的视觉 token 剪枝方法都不是专为自 动驾驶设计的,在自动驾驶场景中都具有局限性。 小鹏汽车联合北京大学计算机科学学院多媒体信息处理国家重点实验室发表论文 《FastDrive ...
AAAI 2026 | 小鹏联合北大,专为VLA模型定制视觉token剪枝方法,让端到端自动驾驶更高效
机器之心· 2026-01-04 05:43
VLA 模型正被越来越多地应用于端到端自动驾驶系统中。然而,VLA 模型中冗长的视觉 token 极大地增加了计算成本。但现有的视觉 token 剪枝方法都不是专为自 动驾驶设计的,在自动驾驶场景中都具有局限性。 小鹏汽车联合北京大学计算机科学学院多媒体信息处理国家重点实验室发表论文 《FastDriveVLA》 ,不仅为自动驾驶 VLA 模型中的高效视觉 token 剪枝建立了新 的范式,也为特定任务的剪枝策略提供了有价值的洞察。 受人类驾驶员主要关注前景区域而非背景区域的启发,研究团队做出假设:对于自动驾驶而言,与前景信息相关的视觉 token 比与背景内容相关的视觉 token 更有价 值。为了验证这个假设,研究团队构建了大规模自动驾驶标注数据集 nuScenes-FG (包含来自 6 个摄像头视角的、带有前景区域标注的 24.1 万个图像 - 掩码对), 通过 MAE 风格的 像素重建 策略 和新颖的 对抗性前景 - 背景重建 策略,训练出了一个适用于不同 VLA 模型的、可以即插即用的 视觉 token 剪枝器 ReconPruner 实验结果显示, 在不同剪枝比例下,FastDriveVLA 在 ...
为什么蔚来会押注世界模型?
自动驾驶之心· 2026-01-04 01:04
点击下方 卡片 ,关注" 自动驾驶之心 "公众号 戳我-> 领取 自动驾驶近30个 方向 学习 路线 这两天蔚来NWM2.0集中宣发,效果 号称 还不错。根据之前蔚来公开的信息,世界模型可能会有惊喜。任少卿认为智能驾驶真正的上限在世界模型, 即以视频为 核心,通过跨模态的互相预测和重建,让系统学习时空和物理规律 ,让机器能像人一样理解环境。 世界模型解决的是 时空认知 ,语言模型解决的是 概念认知 。语言模型低带宽和稀疏性 无法真正有效的建模真实世界的四维时空(时间+空间)。 世界模型的认知 包含两个层面: 但世界模型的定义仍然很模糊,生成 = 世界模型? 生成 + 重建 = 世界模型。 对于新入行的同学来说,总是搞不明白。 不少同学跟柱哥吐槽,相当多的时间"浪费"在踩 坑上了。 想要搞懂世界模型,完成数据生成、闭环仿真等后续任务,对于初学者来说是非常困难的。有的同学甚至踩了半年坑都无法真的入门,更不用说做改进。 为此自动 驾驶之心联合工业界算法专家,从原理到实战带大家搞懂自动驾驶世界模型领域! 正式开课!添加助理咨询课程~ 讲师介绍 Jason:C9本科+QS50 PhD,已发表CCF-A论文2篇,CCF- ...
2026年,这个自驾社区计划做这些事情......
自动驾驶之心· 2026-01-02 08:08
点击下方 卡片 ,关注" 自动驾驶之心 "公众号 戳我-> 领取 自动驾驶近30个 方向 学习 路线 这两天柱哥也没闲着,琢磨26年星球为大家呈现哪些新内容: 当然,已有的内容我们会争取做的更好: 欢迎大家加入自动驾驶之心知识星球。我们准备了元旦大额新人优惠..... 扛内卷,一个足够有料的社区 对于很多想入门的同学来说,试错成本有点高。没时间和缺乏完整的体系是最大问题,这也容易导致行业壁垒 越来越高,如果想要卷赢那就更加困难了。 所以我们联合了诸多学术界和工业界的大佬,共同打造了我们维护三年之久的『自动驾驶之心知识星球』! 星球目前集视频 + 图文 + 学习路线 + 问答 + 求职交流为一体,是一个综合类的自驾社区,已经超过4000人 星友面对面:目前已经开展了五期,很多星友跟柱哥反馈都不错,今年我们会持续做下去,学术界和工业 界,科研就业和申博,跳槽和转行,前沿技术和下沉领域,争取全面覆盖大家的需求; 专家访谈:25下半年我们陆续接触到一些企业的中高层,计划今年会开展一些技术类的访谈,把行业不同 层级公司关心的内容呈现给大家; 行业调研:智驾的规模化量产,大概率是26年的主线,但与此同时L4赛道也重回大众 ...
中国智能驾驶产业的算力巨变
3 6 Ke· 2025-12-30 10:36
2025 年,在自动驾驶依旧在持续演进的大框架下,中国智能驾驶行业迎来了一个前所未有的算力变 局。 这一变局产生的关键背景是,从软件算法的角度,在整个行业完成面向「端到端」的技术范式演变之 后,各个重要玩家在 2025 年又陷入到一个明显的软件算法路线纷争中。但是,到目前为止,至少在中 国市场,无论是 VLA,还是世界模型,都还无法彻底证明其在最终用户体验层面的碾压性优势。 但更重要的变局支点,在于高阶智驾商业落地层面的分化。 比如,以城市 NOA 为核心产品的高阶智驾,在不同的价格带中呈现出 K 字型的分化,智驾平权和高端 向上这两条截然不同的车型价值线,都在市场竞争的裹挟下混杂其中。这带来了整个行业在高阶智驾的 车端算力落地维度上,不可避免地走向碎片化。 值得一提的是,基于智能驾驶技术的持续演变,也有玩家已经从 L2 出发面向归属于 L4 体系的 Robotaxi 布局——在这种情况下,云端算力加持的作用越来越明显。 当然,在上述一系列看似混沌的变化背后,也存在着一个相对清晰的底层逻辑:算力越来越成为智能驾 驶发展的核心要素。 实际上,如果从技术演变、商业落地和产业分化的多个维度综合观察,我们可以从混沌的 ...
摸底地平线HSD一段式端到端的方案设计
自动驾驶之心· 2025-12-30 00:28
作者 | TryMyBest 编辑 | 自动驾驶之心 原文链接: https://zhuanlan.zhihu.com/p/1983151280315716691 点击下方 卡片 ,关注" 自动驾驶之心 "公众号 戳我-> 领取 自动驾驶近30个 方向 学习 路线 >>自动驾驶前沿信息获取 → 自动驾驶之心知识星球 本文只做学术分享,如有侵权,联系删文 本文主要概述一下地平线一段式端到端方案(HSD)的两篇核心文章: DiffusionDrive + ResAD。 DiffusionDrive给读者们梳理了整体pipeline,ResAD则着重于性能提升的关键:轨迹残差设计。两篇文章都很精彩,也感谢地平线的分享,给从业者带来很多启发。 轨迹生成 本文核心想说的就是轨迹生成部分,所谓"Truncated Diffusion"。文章指出人类驾驶行为并不是随机分布的,具备fix patterns。从这个观察出发,文中 DiffusionDrive 图1: diffisonDrive整体架构 DiffusionDrive的整体架构如图1,可以拆成三部分:1. 感知信息 2.导航信息 3.轨迹生成 感知信息 感知信息本 ...