Workflow
自动驾驶之心
icon
Search documents
某头部车企的自研大考......
自动驾驶之心· 2025-09-26 16:03
以下文章来源于红色星际 ,作者红色星际科技 红色星际 . 让更多人,更深入地了解自动驾驶行业! 作者 | 红色星际科技 来源 | 红色星际 点击下方 卡片 ,关注" 自动驾驶之心 "公众号 戳我-> 领取 自动驾驶近30个 方向 学习 路线 >>自动驾驶前沿信息获取 → 自动驾驶之心知识星球 某头部车企的智驾自研团队到了要"大考"冲刺交卷时刻了。据悉,今年内部制定的目标是9月30日研发出无图城区NOA,12月30日研发出端到端。 这是一场重要的限时"大考" ,对于智能化总负责人以及算法负责人来说,能不能如期交卷,决定了其未来的前途命运。 目前自研量产上车的高速NOA还非常依赖高精地图,即使把无图城区NOA和端到端自研出来,在研发进度也落后新势力以及头部智驾公司至少一年多。 如果不能如期交卷,就实在说不过去了,这家头部车企的BOSS就要问责了,会引发一波动荡。过去两年这家头部车企自研智驾上算是非常动荡,经历了几轮调整 重组,技术负责人换来换去。 更何况智驾研发上的投入非常大,已经超过了一些新势力。所以,智能化总负责人压力满满。 BOSS非常重视智驾,并将其视为未来战略的重中之重,所以研发投入非常舍得花钱。为了招 ...
对比之后,VLA的成熟度远高于世界模型...
自动驾驶之心· 2025-09-26 16:03
作者 | 周彦武 来源 | 佐思汽车研究 点击下方 卡片 ,关注" 自动驾驶之心 "公众号 戳我-> 领取 自动驾驶近30个 方向 学习 路线 首先需要指出VLA和世界模型都是端到端的一种,尽管很多人都认为一段式端到端比分段式优秀,但无论是产业界还是学术界,90%以上都是分段式端到端,纯 粹的VLA和世界模型非常罕见。 代表VLA阵营出战的是高德地图的 模型,地平线的SENNA模型,还有加州大学洛杉矶分校的AutoVLA。代表世界模型出战的有和特斯拉中国 FSD很接近的上海AI实验室的GenAD模型,做重卡自动驾驶的中科慧拓的GenAD模型,华为和浙江大学合作的Drive-OccWorld,还有理想汽车的World4Drive,理 想汽车尽管推崇VLA,但对世界模型的研究水平也是极高的。 | 模型名称 | L2平均距离(米) | 3秒平均碰撞率 | 备注 | | --- | --- | --- | --- | | AutoDrive-R2 | 0.19 | | 70亿参数版 | | AutoDrive-R2 | 0.49 | | 30亿参数版 | | SENNA | 0.22 | 0.08% | 加入自车状态 ...
自动驾驶之心国庆&中秋节活动进行中(课程/星球/硬件优惠等)
自动驾驶之心· 2025-09-26 16:03
星球优惠!新人七折续费五折 星球核心内容一览! 驾 + 具 身 所有课程 频售课程除夕 ▲星球福利 / xING QIU FU LI 7折优惠,立减80 7折优惠, 立减99 节后将再次涨价 赠送7门精品课程 具身智能之心 自动驾驶之心 ▲ 福利专区 /FU LI ZHUAN QU O 1.大模型星球 99元一年,(技术 + 行 业 + 求职) 2. 1v1辅导辅导最高1000抵扣 5000 3.1v6论文辅导立减*1000 4. 超级折扣卡:*299元 自驾课程七折 优惠 (一年期) ▲ 伊件福利 /YIN JIAN FU LI 欢迎添加小助理咨询活动详情! 平台课程八折优惠券 超级折扣卡!课程享受七折优惠 自动驾驶之心 知识星球 技 最前沿的 自驾技术社区 术 f 7 P 7 5 r 6 自动驾驶VLA 世界模型 闭环仿真 扩散模型 BEV感知 --- 近40+学习路线 保持活力,持续学习 交 学术界&工业界 大佬面对面交流 4 r r VLA和WA的路线之争 未来自驾的发展方向 世界模型到底model了个館? 关于端到端的讨论 星友面对面 直击行业第一线 直 → 顶会作者亲临 播 6 f t r r I ...
AnchDrive:一种新端到端自动驾驶扩散策略(上大&博世)
自动驾驶之心· 2025-09-26 07:50
端到端多模态规划已成为自动驾驶领域的变革性范式,能有效应对行为多模态问题及长尾场景下的 泛化挑战。 本文提出端到端框架AnchDrive,该框架可有效引导扩散策略(diffusion policy),以降低传统生成 模型的高计算成本。 与从纯噪声开始去噪不同,AnchDrive利用丰富的混合轨迹锚点(hybrid trajectory anchors)为规划器 初始化。这些锚点来源于两个互补的数据源:一是包含通用驾驶先验知识的静态词汇表,二是一组 动态的、具备情境感知能力的轨迹。其中,动态轨迹由Transformer实时解码生成,该Transformer可 处理密集型与稀疏型感知特征。随后,扩散模型通过学习预测轨迹偏移分布来优化这些锚点,从而 实现精细化调整。这种基于锚点的引导式设计,能够高效生成多样化、高质量的轨迹。在NAVSIM 基准测试中的实验表明,AnchDrive达到了新的性能上限(state-of-the-art),并展现出强大的泛化能 力。 更多关于端到端自动驾驶、VLA、世界模型的前沿技术,欢迎加入『自动驾驶之心知识星球』! 一、引言 近年来,端到端自动驾驶算法受到广泛关注,其相较于传统基于规 ...
29.88万的ES8,蔚来终于开窍了...
自动驾驶之心· 2025-09-26 03:45
以下文章来源于AutoLab ,作者许敏 AutoLab . 掌握汽车创新潮流,从关注AutoLab开始 作者 | 许敏 来源 | AutoLab 点击下方 卡片 ,关注" 自动驾驶之心 "公众号 戳我-> 领取 自动驾驶近30个 方向 学习 路线 今年的NIO Day并不是很热闹,原因很简单,因为大家都在守着手机等锁单。 有个小细节,发布会上,李斌口头强调了两次,在9月20日当晚21点30分之前下订,会享受一系列预定权益,强化了时间紧张,刺激了在座观众,颇有一番 销售技巧。 两款车,81.8万的ET9地平线特别版和40.68万起的全新ES8。 前者篇幅不多,是蔚来对于豪华天花板的极致表达; 而后者,我理解为是蔚来放下身段走向主流的全新开局。 全新ES8有三张王牌,第一张牌是空间: 同一个舞台,两款车却指向了完全不同的方向。 问题是,蔚来真正想赢下的是哪一条路? 全新ES8的普惠 关于全新ES8的信息,我们不再这篇文章里赘述,详情可以参照我们之前写的文章: 《30万的蔚来全新ES8,一场迟到的成人礼》 按照李斌的话来说,"这一次不会让大家再坐三个小时,但我们也还是来一个快速省流版。" 这是一台被寄予厚望的旗舰 ...
有一定深度学习基础,该如何入门自动驾驶?
自动驾驶之心· 2025-09-25 23:33
欢迎添加小助理咨询活动详情! 平台课程八折优惠券 超级折扣卡!课程享受七折优惠 自动驾驶的技术栈更新实在是太快了!三年前还是BEV,两年前是无图,一年期是端到端,今年是VLA和世界模型,下一步是什么呢?现在入行怎么才 能保证毕业不会被淘汰? 其实没什么捷径,只有持续不断的更新自己的认知,这条最困难但却是最正确的路。 所以我们平台搭建了自动驾驶、具身智能和大模型三个平台,在变化中不断摸索前行的道路并反过来提升自己。别盼着稳定,要在变化里找新机会。 我们也在尽自己最大的力量推动行业的进步,如果你也想和我们一起前行,欢迎关注我们国庆节&中秋节的活动!喜逢国庆和中秋节节日,我们推出了今 年最大的优惠活动给大家,欢迎微信咨询小助理。 这一个月柱哥收到了很多的咨询,最具代表性的是:有一些深度学习的基础,怎么才能高效入门自动驾驶? 星球优惠!新人七折续费五折 星球核心内容一览! 自动驾驶之心 知识星球 技 最前沿的 自驾技术社区 术 f 7 P 7 5 r 6 自动驾驶VLA 世界模型 闭环仿真 扩散模型 BEV感知 --- 近40+学习路线 保持活力,持续学习 交 学术界&工业界 大佬面对面交流 4 r r VLA和WA ...
如何向一段式端到端注入类人思考的能力?港科OmniScene提出了一种新的范式...
自动驾驶之心· 2025-09-25 23:33
如何向一段式端到端注入人类思考的能力? 人类视觉能够将2D观察结果转化为以自身为中心的3D场景理解,这一能力为理解复杂场景和展现自适应行为提供了基础。然而当前自动驾驶系统仍缺乏 这种能力—主流方法在很大程度上依赖于基于深度的三维重建,而非真正的场景理解。 为解决这一局限,港科、理想和清华的团队提出一种全新的类人框架OmniScene。 首先本文引入OmniScene视觉-语言模型(OmniVLM),这是一种结合 环视感知与时序融合能力的VLM框架,可实现全面的4D场景理解。其次通过师生结构的OmniVLM架构与知识蒸馏,将文本表征嵌入3D实例特征中以实 现语义监督,既丰富了特征学习过程,又明确捕捉了类人的注意力语义信息。这些特征表征进一步与人类驾驶行为对齐,形成更贴近人类认知的"感知-理 解-行动"架构。 此外本文提出分层融合策略(HFS),以解决多模态融合过程中模态贡献不平衡的问题。该方法能在多个抽象层级上自适应校准几何特征与语义特征的相 对重要性,实现视觉模态与文本模态互补信息的协同利用。这种可学习的动态融合机制,使得异质信息能够被更细致、更有效地挖掘。 本文在nuScenes数据集上对OmniScene ...
超高性价比3D扫描仪!点云/视觉全场景厘米级重建
自动驾驶之心· 2025-09-25 23:33
每秒20万级点云成图,70米测量距离,360°全域覆盖,支持20万平米以上的大场景,扫描可选配3D高斯数据采 集模块,实现高保真实景还原。支持跨平台集成,配备高带宽网口及双USB 3.0接口,为科研实验提供灵活扩展 空间。降低开发门槛,助力开发者快速掌握研发能力,开启更多可能。 GeoScan S1设备自带手持Ubuntu系统和多种传感器设备,手柄集成了电源,可通过D-TAP转XT30母头输出至 GeoScan S1设备本体,给雷达、摄像头以及主控板提供电源。 基础版重建效果一览! 使用门槛低 :操作简单直观,一键启动即可 执行扫描作业 扫描结果导出即用 :无需复杂部署和繁琐处理,扫 描结果导出即用 高效率高精度建图 :模型精度高,行走之间轻松扫 描大场景 业内最优惠价格 :性价比高,高度 集成多传感器, 往下翻~ 最强性价比3D激光扫描仪 面向工业场景和教研场景的 超高性价比3D扫描仪来了!GeoScan S1是国内目前最强性价比实景三维激光扫描 仪,轻量化设计,一键启动,便可拥有高效实用的三维解决方案。以多模态传感器融合算法为核心,实现厘米级 精度的三维场景实时重构。可广泛用于多种作业领域。 重磅!3DG ...
从现有主流 RL 库来聊聊RL Infra架构演进
自动驾驶之心· 2025-09-25 23:33
作者 | Lancer 编辑 | 大模型之心Tech 原文链接: https://zhuanlan.zhihu.com/p/1951435056154386911 点击下方 卡片 ,关注" 大模型之心Tech "公众号 戳我-> 领取大模型巨卷干货 在大模型的发展进程中,强化学习(RL)已从一项辅助技术,跃升为驱动模型能力跃迁的核心动力。当前,RL发展正经历一场关键范 式转移:从单轮、静态任务(如独立的数学题求解等),全面转向多轮、交互式智能体训练。这一新范式的目标,是让大模型真正成为 能在复杂、动态环境中,通过多步观察、思考、行动与反馈来完成任务的Agent。这不仅是技术上的巨大挑战,更是通往AGI的关键一 步。 总而言之,强化学习正在重塑大模型的能力边界。它不仅是弥补数据瓶颈的利器,更是构建下一代通用智能体的核心方法论。而支撑这 一切的,正是背后日益成熟和强大的RL基础设施生态。 本 文 结 合 A Survey of Reinforcement Learning for Large Reasoning Models 和 Anyscale blog 对 现 有 主 流 RL 库 进 行 简 单 整 理。 ...
打算招聘几位大佬共创平台(4D标注/世界模型/VLA/模型部署等方向)
自动驾驶之心· 2025-09-25 07:36
点击下方 卡片 ,关注" 自动驾驶之心 "公众号 戳我-> 领取 自动驾驶近15个 方向 学习 路线 业务合伙人 自动驾驶之心业务合伙人招募来啦!我们团队今年计划向国内外招募10名优秀的合伙人,负责自动驾驶相 关课程研发、论文辅导业务开发、硬件研发; 主要方向 如果您是大模型/多模态大模型、扩散模型、VLA、端到端、具身交互、联合预测、SLAM、3D目标检测、 世界模型、闭环仿真3DGS、大模型部署与量化感知推理等方向,欢迎加入我们; 丰厚的现金激励; 创业项目合作与推荐; 联系我们 更多欢迎添加微信咨询,备注" 机构/公司 + 自动驾驶合作咨询 "。 岗位要求 QS200以内高校,硕士及以上学历,手握顶会的大佬优先。 待遇说明 自动驾驶资源共享(求职、读博、出国留学推荐等); ...