Workflow
自动驾驶之心
icon
Search documents
为什么做不好4D自动标注,就做不好智驾量产?
自动驾驶之心· 2025-06-25 09:48
点击下方 卡片 ,关注" 自动驾驶之心 "公众号 戳我-> 领取 自动驾驶近15个 方向 学习 路线 千万级4D标注方案应该怎么做? 智能驾驶算法的开发已经到了深水区,各家都投入了大量的精力去做量产落地。其中一块最关键的就是如何高效的完成4D数据自动标注。一方面人工精标周期长、成 本贵,对于量产泛化的关键周期是非常大的阻力,因此高质量的4D自动标注是业内非常重要的一环,无论是3D动态目标、OCC、静态标注还是端到端标注。 相比于车端的感知算法,自动标注系统更像是一个不同模块组成的系统, 充分利用离线的算力和时序信息,才能得到更好的感知结果, 实际落地的时候,对于工程师 的能力要求上了一个档次,想要把这些大模型大系统玩转的好和高效,也是非常不容易的。 而自从端到端和大语言LLM横空出世以来,大规模无监督的预训练 + 高质量数据集做具体任务的微调, 可能也会成为量产感知算法下一阶段需要发力的方向。同时数 据的联合标注也是当下各家训练模型的实际刚需,以往分开标注的范式不再适合智能驾驶的算法发展需求。今天自动驾驶之心就和大家一起分享下4D数据的标注流 程: 最复杂的当属动态障碍物的自动标注,涉及四个大的模块: 而为了 ...
BEV高频面试问题汇总!(纯视觉&多模态融合算法)
自动驾驶之心· 2025-06-25 02:30
点击下方 卡片 ,关注" 自动驾驶之心 "公众号 戳我-> 领取 自动驾驶近15个 方向 学习 路线 写在前面 自BEVFormer带起BEV感知热潮以来,从BEVDet到PETR、BEVDepth、BEVFusion,再到最近火热的 InternBEV、BEV-Lane系列,BEV(Bird's Eye View)感知已经成为视觉感知中的兵家必争之地。不仅如此,随 着多模态融合、时间建模、实时性优化等技术不断取得突破,BEV感知的实际落地也正在加速推进。2024年以 来,地平线、文远、小鹏、比亚迪、毫末等厂商纷纷投入量产研发,不少团队也将BEV作为核心视觉模块融入自 研的自动驾驶栈。 如今2025年已过半, BEV感知领域还有哪些值得重点关注的新技术?哪些论文提出了真正具有变革性的想法? 有哪些方法已经在量产项目中落地? 这些问题,都是每一位前沿从业者和技术爱好者无法回避的思考方向为 此,自动驾驶之心对 BEV感知方向的相关提问和回答进行了系统汇总 ,看不过瘾可以关注文末附上的资料,感 兴趣的小伙伴千万别错过呦 BEV知多少 在bev空间上,要检测A目标,肯定要用对应的A目标特征,拿其他目标的特征过来有啥用 ...
为什么一篇论文要耗尽整个研究生生涯?
自动驾驶之心· 2025-06-25 02:30
点击下方 卡片 ,关注" 自动驾驶之心 "公众号 戳我-> 领取 自动驾驶近15个 方向 学习 路线 能辅导哪些会议和期刊? 收到了许多同学在论文发表上的求助,学校绕不开一篇三区论文硕士毕业,没有三篇CCF-A博士都毕不了 业,老师对这个新的方向不熟悉,开展不了工作。一直在为论文选题绞尽脑汁,实验设计总遇瓶颈,写作 逻辑混乱不清,投稿屡屡被拒! 尤其是在前沿且复杂的自动驾驶、具身智能、机器人领域,真的有点力不 从心! 一篇论文往往需要1-2年的时间筹备发出,对硕士来说,基本上贯穿了整个学术生涯。方法错误、走弯路、 无人指点是最消耗时间的!论文发表难,但也不是没有办法,有大佬带队,一年发几篇都很正常。筹备了 好久,我们服务大家的论文辅导正式推出了,面向自动驾驶/具身智能/机器人领域。 我们是谁? 国内最大的AI类技术自媒体平台,IP包含自动驾驶之心/具身智能之心/3D视觉之心等平台,拥有国内最顶 尖的学术资源。深耕 自动驾驶、具身智能、机器人 方向多年。我们深刻理解这些交叉学科的挑战与机遇, 更明白一篇高质量论文对于学生(尤其是硕博生)学业和未来发展的重要性。 我们300+专职于自动驾驶/具身智能方向的老师。来 ...
穆尧团队最新!RoboTwin 2.0:用于鲁棒双臂操作的可扩展数据基准
自动驾驶之心· 2025-06-24 12:41
以下文章来源于具身智能之心 ,作者Tianxing Chen等 具身智能之心 . 与世界交互,更进一步 点击下方 卡片 ,关注" 具身智能 之心 "公众号 作者丨 Tianxing Chen等 编辑丨具身智能之心 本文只做学术分享,如有侵权,联系删文 >> 点击进入→ 具身智能之心 技术交流群 更多干货,欢迎加入国内首个具身智能全栈学习社区 : 具身智能之心知识星球 (戳我) , 这里包含所有你想要 的。 天行和muyao大佬团队出品的2.0工作,看看有哪些创新点和惊喜吧~ Webpage: https://robotwin-platform.github.io/ arXiv:https://arxiv.org/abs/2506.18088 Code: https://github.com/RoboTwin-Platform/RoboTwin Document: https://robotwin-platform.github.io/doc/ Title:RoboTwin 2.0: A Scalable Data Generator and Benchmark with Strong Domain Rando ...
谈薪避坑、跨行转岗?自动驾驶/具身求职,AutoRobo星球一站搞定!
自动驾驶之心· 2025-06-24 12:41
做了3年多的技术自媒体,在自驾、具身智能、3D视觉、机器人领域,我们沉淀了大量的内容。但后期陆 续收到了许多同学关于就业的求助,谈薪、避坑、职位选择、跨行等都是大家很关注的问题。我们一直 想给大家这样一个平台,让需要就业的同学能够快速匹配到自己的岗位,事半功倍!近半年的筹划,我 们推出了AutoRobo知识星球,一个覆盖机器人、自动驾驶、具身智能方向的求职社区! AutoRobo知识星球 这是一个给自动驾驶、具身智能、机器人方向同学求职交流的地方,目前近1000名成员了,成员范围包 含已经工作的社招同学,如地平线、理想汽车、华为、小米汽车、momenta、元戎启行等公司。同时也 包含2024年秋招、2025年秋招的小伙伴,方向涉及自动驾驶与具身智能绝大领域。 星球内部有哪些内容?这一点结合我们已有的优势,给大家汇总了面试题目、面经、行业研报、谈薪技 巧、还有各类内推公司、简历优化建议服务。 招聘信息 星球内部日常为大家分享已有的算法、开发、产品等岗位,基本都是公司第一时间分享给我们的!涉及 校招、社招、实习等岗位。 点击下方 卡片 ,关注" 自动驾驶之心 "公众号 戳我-> 领取 自动驾驶近15个 方向 学习 ...
基于LSD的4D点云底图生成 - 4D标注之点云建图~
自动驾驶之心· 2025-06-24 12:41
作者 | LiangWang 编辑 | 自动驾驶之心 点击下方 卡片 ,关注" 自动驾驶之心 "公众号 戳我-> 领取 自动驾驶近15个 方向 学习 路线 >>点击进入→ 自动驾驶之心 『4D标注』技术交流群 本文只做学术分享,如有侵权,联系删文 近几年随着深度学习技术的发展,基于数据驱动的算法方案在自动驾驶/机器人领域逐渐成为主流,因此算法对数据的要求也越来越大。区别于传统单帧标注,基 于高精点云地图的4D标注方案能够有效减少标注成本并提高数据真值质量。 4D标注中的4D是指三维空间+时间维度,4D数据能够映射到任意时刻得到单帧真值用于模型训练,区别于大范围高精地图生产,4D标注只关注一小片区域的静态 和动态元素。然而如何生成标注所需底图是其中的一个关键环节,针对不同的标注需求,通常需要实现"单趟建图","多躺建图"和"重定位"等关键技术,在场景上 还需要支持有GNSS的行车场景和无GNSS的泊车场景。 LSD (LiDAR SLAM & Detection) 是一个开源的面向自动驾驶/机器人的环境感知算法框架,能够完成数据采集回放、多传感器标定、SLAM建图定位和障碍物检测 等多种感知任务。 本文将详细介 ...
大佬面对面!斯坦福2025 CS336课程全公开:从零开始搓大模型~
自动驾驶之心· 2025-06-24 11:47
点击下方 卡片 ,关注" 自动驾驶之心 "公众号 戳我-> 领取 自动驾驶近15个 方向 学习 路线 从事大模型方向的小伙伴有福利了!斯坦福大学 2025 年春季的 CS336 课程「从头开始创造语言模型(Language Models from Scratch)」相关课程和材料现已在网上全面发布! 该课程教职工团队,阵容十分豪华~ 课程视频:https://www.youtube.com/watch? v=SQ3fZ1sAqXI&list=PLoROMvodv4rOY23Y0BoGoBGgQ1zmU_MT_ 课程主页:https://stanford-cs336.github.io/spring2025/ 讲师Tatsunori Hashimoto:现为斯坦福大学计算机科学系助理教授。其为斯坦福大学 John C. Duchi 和 Percy Liang 的博士后,研究机器学习模型平均性能和最差性能之间的权衡。此前在麻省理工学院攻读研究生,导师是 Tommi Jaakkola 和 David Gifford。本科就读于哈佛大学学习统计学和数学,导师是 Edoardo Airoldi。并且该讲 师的研究成果已 ...
华为车BU招聘(端到端/感知模型/模型优化等)!岗位多多~
自动驾驶之心· 2025-06-24 07:21
点击下方 卡片 ,关注" 自动驾驶之心 "公众号 戳我-> 领取 自动驾驶近15个 方向 学习 路线 华为车bu(引望)社招: 端到端模型算法工程师 1. 承担端到端模型的设计、开发、部署和迭代 感知模型算法工程师 1. 承担视觉感知相关的神经网络设计、开发、部署和迭代 4. 承担视觉感知算法的长期研发和迭代 人脸状态监测算法工程师 1. 负责智能驾驶系统,驾驶员和乘客姿态,行为和视线监测算法研发和部署 2. 针对现网问题和用户新需求,快速设计算法方案,解决问题满足客户需求 3. 结合业界算法前沿,推动算法优化迭代,确保算法业界竞争力领先 模型效率优化 1. 承担智能驾驶系统AI模型车端推理效率优化 2. 针对现网问题,优化迭代效率和方案;加速问题解决 3. 结合业界前沿和实际应用问题,推动新算法预研和落地 4. 分析端到端数据分布,均衡和调优 2. 构建AI模型压缩核心算法,设计和构建硬件亲和的模型稀疏、剪枝、蒸馏、量化等压缩能力 3. 紧跟业界前沿模型压缩方案,结合AI模型不断提升模型时延、内存带宽等指标~ 欢迎感兴趣的朋友加入自动驾驶之心知识星球获取联系方式,内部独家招聘信息,简历直达!!! 前面一直在 ...
SwitchVLA:无需额外数据采集,即可实时动态任务切换的轻量化VLA模型
自动驾驶之心· 2025-06-24 02:54
点击下方 卡片 ,关注" 具身智能 之心 "公众号 作者丨 Meng Li等 >> 点击进入→ 具身智能之心 技术交流群 编辑丨具身智能之心 本文只做学术分享,如有侵权,联系删文 更多干货,欢迎加入国内首个具身智能全栈学习社区 : 具身智能之心知识星球 (戳我) , 这里包含所有你想要 的。 1简Intr 介 oduction - 基于模仿学习,目前主流的多任务 VLA 模型及其训练方式无法很好的应对任务变更问题。比如, 当任务A进行一半时,此时切换任务B,大部分方法解决该问题的能力十分薄弱。 - 诸如此类问题我们定义为 Task Switching ,即"任务切换"。为解决该问题,我们设计了执行感知 (Execution-Aware)机制,通过极简的形式表示了任务切换的情况。在模型侧采用了轻量化的网络 架构,并设计了新的训练范式及数据采样算法。 - 我们的方法 轻量 (0.27B)且 无需额外收集遥操数据 ,便可实现任务切换功能,并大幅超越现有 SOTA VLA 方法。 - 论文地址:https://arxiv.org/abs/2506.03574 - 项目网站:https://switchvla.gith ...
端到端系列!SpareDrive:基于稀疏场景表示的端到端自动驾驶~
自动驾驶之心· 2025-06-23 11:34
本文认为现有的端到端方法主要存在两个问题:一个是BEV范式下的方法非常耗算力;另一个是预测和planning串联式的方式不够好,场景信息是在 agent周围提取,忽略了自车。并且运动预测和规划都是多模态问题。基于此,本文提出一种Sparse范式下的端到端方法,且预测和planning并行。 Contribution: SparseDrive的主体结构沿用了之前地平线Sparse系列的思想: 点击下方 卡片 ,关注" 自动驾驶之心 "公众号 戳我-> 领取 自动驾驶近15个 方向 学习 路线 探索了端到端自动驾驶的稀疏场景表示,并提出了一种以稀疏为中心的范式; 修改了运动预测和规划之间的巨大相似性,提出了一种分层规划选择策略; nuScenes 上 SOTA。 特征提取; 对称稀疏感知; 平行运动规划器; 训练的损失函数如下: SparseDrive: 损失函数 www.zdjszx.com □ Loss $${\mathcal{L}}={\mathcal{L}}_{d e t}+{\mathcal{L}}_{m a p}+{\mathcal{L}}_{m o t i o n}+{\mathcal{L}}_{p ...