自动驾驶之心

Search documents
2026届自动驾驶算法岗招聘,趋势变化有些大。。。
自动驾驶之心· 2025-06-19 10:47
点击下方 卡片 ,关注" 自动驾驶之心 "公众号 戳我-> 领取 自动驾驶近15个 方向 学习 路线 本篇文章针对26届自动驾驶和互联网求职同学,和大家一起聊聊今年招聘大趋势的边和和秋招的进程。欢迎大家 收藏转发~ 大趋势的变化 去年自动驾驶和互联网整体上都不太景气,诸多公司宣布裁员、倒闭。25届的很多同学都遭遇了校招滑铁卢。今 年业内不少公司都缓过来一口气,开始回复大规模招聘(小米、比亚迪、小鹏等等),预计26届的行情整体还是 可以的,有希望追平24届。 还有一点不同,提前批的效力在逐年减弱,甚至可以说名存实亡。除了顶级天才真的能拿到提前批的超级offer, 大部分同学基本上都是在七月底到十一月底这个阶段拿到秋招offer,十一月底到过年是秋招补录阶段。 对于大公司来说,暑期实习真的很重要。广义上的可转正暑期实习从2月底会持续到10月底,即使到了秋招的时 候,也都同步会有可转正实习的hc,因为大厂目前更倾向于招聘实习转正的人,第一是更有实际的工作基础,第 二当然也是更好压价,实习转正的薪酬一般都不会开的太高。 请大家一定充分认识到暑期实习的重要性,有条件的同学尽可能的争取到一份暑期实习,联系下毕业的学长学姐 ...
斯坦福最新!大模型的幻觉分析:沉迷思考=真相消失?
自动驾驶之心· 2025-06-19 10:47
点击下方 卡片 ,关注" 大模型之心Tech "公众号 戳我 -> 领取大模型巨卷干货 今天 大模型之心Tech 为大家分享一篇大模型相关论文。本文 深入 探讨了 多模态推理模型中推理能力与幻觉之间的平衡 问题 。如果您有相 关工作需要分享,请在文末联系我们! 本文只做学术分享,如有侵权,联系删文 论文作者:Chengzhi Liu等 作者单位:加州大学、斯坦福大学 项目主页:https://mlrm-halu.github.io/ 解决方案: 不如设计一个能跟踪推理长度变化的指标吧! 于是, RH-AUC 诞生了——它就像一个"动态平衡仪",能画出"推理长度vs.感知准确率"的曲线,算出曲 线下面积(AUC),数值越高,说明模型在不同推理长度下越能"稳得住视觉基本盘"。 前言 自从以 DeepSeek-R1 为代表的 推理LLM 进入研究者广泛讨论范围后, 多模态推理模型 也在推理LLM的基础上,数月内掀起了狂热浪潮,各种工作层出不穷 (PS:这里可查看我们社区为大家汇总的多模态推理模型相关工作 这里查看「多模态推理模型」热门工作汇总(上)~ ; 盘一盘「多模态推理模型」近期热门工作 (下)~ )。 今天就 ...
高质量3DGS表示!𝒳-Scene:新颖的大规模驾驶场景生成框架~
自动驾驶之心· 2025-06-19 10:47
以下文章来源于3D视觉之心 ,作者3D视觉之心 3D视觉之心 . 3D视觉与SLAM、点云相关内容分享 点击下方 卡片 ,关注" 3D视觉之心 "公众号 第一时间获取 3D视觉干货 >> 点击进入→ 具身智能之心 技术交流群 更多干货,欢迎加入国内首个具身智能全栈学习社区 : 具身智能之心知识星球 (戳我) , 这里包含所有你想要的。 大规模场景生成的挑战 近年来,生成式人工智能的进步对自动驾驶产生了深远影响,其中扩散模型成为数据合成和驾驶仿真的关键工具。 一些方法将扩散模型作为数据生成机器,用于生成高保真的驾驶视频或多模态的合成数据,以增强感知任务,并生 成如车辆插队等关键但罕见的情况,从而丰富规划数据。除此之外,还有一些方法将扩散模型作为世界模型,用于 预测未来的驾驶状态,从而实现端到端的规划和闭环仿真。这些研究主要强调通过时间递归生成长期视频,鼓励扩 散模型输出时序一致的视频序列,以服务于后续任务。 然而,具备空间扩展能力的大规模场景生成仍是一个新兴但尚未被充分研究的方向,其目标是构建可用于任意驾驶 仿真的广阔而沉浸式的三维环境。一些开创性工作已经探索了大规模的三维驾驶场景生成。例如,有的方法利用扩 散 ...
CVPR'25端到端冠军方案!GTRS:可泛化多模态端到端轨迹规划(英伟达&复旦)
自动驾驶之心· 2025-06-19 10:47
今天自动驾驶之心为大家分享 英伟达、复旦大学 最新的工作! GTRS:可泛化的 多模式端到端轨迹规划! 如果您有相关工作需要分享,请在文末联系我们! 自动驾驶课程学习与技术交流群事宜,也欢迎添加小助理微信AIDriver004做进一 步咨询 >>点击进入→ 自动驾驶之心 『端到端自动驾驶』技术交流群 论文作者 | Zhenxin Li等 编辑 | 自动驾驶之心 论文链接:https://arxiv.org/abs/2506.06664 Github:https://github.com/NVlabs/GTRS NVIDIA技术博客:https://blogs.nvidia.com/blog/auto-research-cvpr-2025/?ncid=so-nvsh-677066 CVPR 2025 Autonomous Grand Challenge: https://opendrivelab.com/legacy/challenge2025/index.html 点击下方 卡片 ,关注" 自动驾驶之心 "公众号 戳我-> 领取 自动驾驶近15个 方向 学习 路线 端到端自动驾驶挑战赛背景 NAVSIM v2 ...
调研了一圈,还是更想做自动驾驶!
自动驾驶之心· 2025-06-19 06:30
重磅!预售来啦。面向科研&教学级自动驾驶全栈小车黑武士系列001正式开售了。世界太枯燥了,和我们一起做点有意思的事情吧。 原价36999元,现 在下单赠送3门课程( 模型部署+点云3D检测+多传感器融合 ),优先锁定的安排组装发货。 这两个月订单排满了,正在不断组装调试,5台及以上订单可以优惠哦!欢迎高校和研究院所批量采购。感兴趣的同学可以早点下单哦~ 1)黑武士001 我们测试了室内、室外、地库等场景下感知、定位、融合、导航规划等功能; 整体功能介绍 本科生学习进阶+比赛;√ 研究生科研+发论文;√ 研究生找工作+项目;√ 高校实验室教具;√ 培训公司/职业院校教具;√ 户外公园行驶 点云3D目标检测 自动驾驶之心团队推出的教研一体轻量级解决方案,支持感知、定位、融合、导航、规划等多个功能平台,阿克曼底盘。 黑武士支持二次开发和改装,预留了众多安装位置和接口,可以加装相机、毫米波雷达等传感器; 2)效果展示 室内地库2D激光建图 室内地库3D激光建图 上下坡测试 室外大场景3D建图 室外夜间行驶 3)硬件说明 | 主要传感器 | 传感器说明 | | --- | --- | | 3D激光雷达 | Mid 36 ...
自动驾驶中常提的VLA是个啥?
自动驾驶之心· 2025-06-18 13:37
以下文章来源于智驾最前沿 ,作者陈云培 智驾最前沿 . 自动驾驶领域专业的技术、资讯分享全媒体平台。我们的slogan是:聚焦智能驾驶 ,紧盯行业前沿。 VLA 全称为" Vision-Language-Action ",即视觉 - 语言 - 动作模型,其核心思想是将视觉感知、语 言理解与动作决策端到端融合,在一个统一的大模型中完成从环境观察到控制指令输出的全过程。与传统 自动驾驶系统中感知、规划、控制模块化分工的思路不同, VLA 模型通过大规模数据驱动,实现了"图像 输入、指令输出"的闭环映射,有望大幅提高系统的泛化能力与场景适应性。 VLA 最早由 GoogleDeepMind 于 2023 年在机器人领域提出,旨在解决"视觉 - 语言 - 动作"三者协同 的智能体控制问题。 DeepMind 的首个 VLA 模型通过将视觉编码器与语言编码器与动作解码器结合,实 现了从摄像头图像和文本指令到物理动作的直接映射。这一技术不仅在机器人操作上取得了突破,也为智 能驾驶场景引入了全新的端到端思路。 在自动驾驶领域, 感知技术 通常由雷达、激光雷达、摄像头等多种传感器负责感知,感知结果经过目标 检测、语义分割、轨 ...
AI Day直播!清华&吉利Challenger框架:自动驾驶对抗场景高效生成~
自动驾驶之心· 2025-06-18 13:37
本文提出了Challenger框架,首次实现了物理合理且视觉逼真的对抗性驾驶视频生成。其突破性在于通过两项 关键技术解决了轨迹空间优化与高保真传感器数据生成的联合挑战: 该框架在nuScenes数据集上生成多样化对抗场景(如强行切入、盲区超车、跟车过近),并利用 MagicDriveDiT渲染器输出多视角逼真视频。实验表明,所生成场景显著提升主流端到端自动驾驶模型(如 UniAD、VAD)的碰撞率(最高达26倍),且发现的对抗行为具有跨模型可迁移性,揭示了自动驾驶系统的共 性脆弱性。 自 动 驾 驶 之 心 论论论论论论论论文文文文文文文文文文文文文文文文文文辅辅辅辅辅辅辅辅导导导导导导导导来来来来来来来来啦啦啦啦啦啦啦啦 知知知知知知知知识识识识识识识识星星星星星星星星球球球球球球球球交交交交交交交交流流流流流流流流社社社社社社社社区区区区区区区区 >>直播和内容获取转到 → 自动驾驶之心知识星球 近4000人的交流社区,近300+自动驾驶公司与科研结构加入! 涉及30+自动驾驶技术栈学习路线,从0到一 带你入门 自动驾驶感知(大模型、端到端自动驾驶 、 世界模型 、 仿真闭环 、 3D检测 、 车道线 、 ...