端到端

Search documents
小米雷军:SU7 预计 7 月下旬升级端到端辅助驾驶 HAD 全新 1000 万 Clips 版本
news flash· 2025-06-25 12:37
小米创办人、董事长兼CEO雷军今日早发文分享了小米端到端辅助驾驶HAD最近进展:全新1000万 Clips版本,小米YU7全系出厂即搭载;小米SU7预计7月下旬升级。另外他表示,"新版本和现在版本相 比,提升还是非常明显。" ...
SOTA端到端算法如何设计?CVPR'25 WOD纯视觉端到端比赛Top3技术分享~
自动驾驶之心· 2025-06-25 09:54
点击下方 卡片 ,关注" 自动驾驶之心 "公众号 戳我-> 领取 自动驾驶近15个 方向 学习 路线 >>自动驾驶前沿信息获取 → 自动驾驶之心知识星球 CVPR2025 WOD纯视觉端到端比赛放榜了,给大家分享下前三名的技术方案! 太长不看版: 冠军:来自EPFL团队,参考DiffusionDrive,用了nuPlan的数据 + ensembling 的策略; 亚军:Nvidia & Tubingen团队,参考DiffusionDrive 和 SmartRefine,使用CARLA、NaviSim, WOD-P, WOD-E2E 等 4 个数据集,实验对比了不同阶段用不同数据训 练的效果,证明训练数据循序的重要性(实验也用了 ensembling策略,有提升但不多):pre-training可以多但质量差一些的数据,post-trainig 得用高质量的数据 季军:韩国汉阳大学团队,主打一个结构简洁,输入只用前视图+自车状态,最后用一个 trajectory-decoder 输出结果 特别奖:值得一提是这个特别奖,使用QWen2.5-VL,用 72B 的模型生成 CoT数据,最后在 3B 模型上训练~ 特别 ...
显示端到端VLA是什么?有哪些方法?
具身智能之心· 2025-06-25 08:24
什么是显示端到端VLA,提到显示,这一点和隐式是对立的。上一期分享,我们分享了隐式端到端的模型定 义,显示端到端VLA模型视频生成GOAL,明确生成了未来机械臂如何运动的图像!可以浏览下图! 其中还涉及了一个比较重要的概念:逆运动学。 逆运动学 逆运动学主要应用在机器人学、动画学和计算机图形学中,与经典运动学相对。它的目标是根据目标位置,计 算物体(如机械臂或骨骼系统)的各个关节应该如何运动才能到达该目标。 列入在机器人领域,逆运动学会回答这样的实际问题:机械臂的末端(手爪)需要到达某个指定位置,那么每 个关节应该如何旋转。 逆运动学的核心步骤: 已知信息: 求解: 利用矩阵、三角学或迭代方法,计算每个关节的角度或未知,使得末端能够到达目标点。 多解性问题: 逆运动学通用会有多个解(甚至没解),需要在可能的解中选择一个最优解(如最小能量消耗或最自然运 动)。 主要工作一览 3)LAPA 1)开山之作:UniPi 将序列决策问题转化为文本条件视频生成问题:给定文本编码的目标描述,规划器会合成一组未来帧来描绘其 计划执行的行动序列,随后从生成的视频中提取控制动作。通过以文本作为底层目标描述,我们能够自然而然 地实 ...
酷赛港股IPO:竞争激烈的智能手机市场及地缘政治风险
Jin Rong Jie· 2025-06-25 04:11
然而,酷赛也面临着显著的风险与挑战。首先,地缘政治紧张局势特别是美中关税争端可能对公司业务 产生重大不利影响。2025年美国曾将来自中国的进口商品关税提高至145.0%,尽管后来降至30.0%,但 若90天停战期后无法达成全面协议,可能导致关税再度升级,影响贸易稳定性。 其次,酷赛经营所在的智能手机行业竞争极为激烈。全球智能手机端到端解决方案提供商市场主要集中 于中国,公司若无法有效应对市场变化和客户偏好,其竞争力可能下降,业务扩张和盈利能力也将受到 限制。 本文源自:金融界 作者:智研 6月25日,酷赛智能科技股份有限公司(以下简称"酷赛")向港交所提交上市申请书,独家保荐人为中 信证券(香港)有限公司。 酷赛是全球领先的智能科技企业,提供包括产品定义、研发、供应链管理、制造和售后服务的全方位一 站式解决方案。作为本土品牌背后的赋能者,酷赛主要向全球本土品牌和电信运营商提供消费类智能手 机、三防手机以及其他物联网产品。根据弗若斯特沙利文数据,于2024年,按出货量计算,酷赛是全球 第二大面向本土智能手机品牌的端到端解决方案提供商;于2025年第一季度,已升至榜首。 凭借独到的智能硬件产品定义能力,酷赛能够根 ...
华为车BU招聘(端到端/感知模型/模型优化等)!岗位多多~
自动驾驶之心· 2025-06-24 07:21
点击下方 卡片 ,关注" 自动驾驶之心 "公众号 戳我-> 领取 自动驾驶近15个 方向 学习 路线 华为车bu(引望)社招: 端到端模型算法工程师 1. 承担端到端模型的设计、开发、部署和迭代 感知模型算法工程师 1. 承担视觉感知相关的神经网络设计、开发、部署和迭代 4. 承担视觉感知算法的长期研发和迭代 人脸状态监测算法工程师 1. 负责智能驾驶系统,驾驶员和乘客姿态,行为和视线监测算法研发和部署 2. 针对现网问题和用户新需求,快速设计算法方案,解决问题满足客户需求 3. 结合业界算法前沿,推动算法优化迭代,确保算法业界竞争力领先 模型效率优化 1. 承担智能驾驶系统AI模型车端推理效率优化 2. 针对现网问题,优化迭代效率和方案;加速问题解决 3. 结合业界前沿和实际应用问题,推动新算法预研和落地 4. 分析端到端数据分布,均衡和调优 2. 构建AI模型压缩核心算法,设计和构建硬件亲和的模型稀疏、剪枝、蒸馏、量化等压缩能力 3. 紧跟业界前沿模型压缩方案,结合AI模型不断提升模型时延、内存带宽等指标~ 欢迎感兴趣的朋友加入自动驾驶之心知识星球获取联系方式,内部独家招聘信息,简历直达!!! 前面一直在 ...
端到端系列!SpareDrive:基于稀疏场景表示的端到端自动驾驶~
自动驾驶之心· 2025-06-23 11:34
本文认为现有的端到端方法主要存在两个问题:一个是BEV范式下的方法非常耗算力;另一个是预测和planning串联式的方式不够好,场景信息是在 agent周围提取,忽略了自车。并且运动预测和规划都是多模态问题。基于此,本文提出一种Sparse范式下的端到端方法,且预测和planning并行。 Contribution: SparseDrive的主体结构沿用了之前地平线Sparse系列的思想: 点击下方 卡片 ,关注" 自动驾驶之心 "公众号 戳我-> 领取 自动驾驶近15个 方向 学习 路线 探索了端到端自动驾驶的稀疏场景表示,并提出了一种以稀疏为中心的范式; 修改了运动预测和规划之间的巨大相似性,提出了一种分层规划选择策略; nuScenes 上 SOTA。 特征提取; 对称稀疏感知; 平行运动规划器; 训练的损失函数如下: SparseDrive: 损失函数 www.zdjszx.com □ Loss $${\mathcal{L}}={\mathcal{L}}_{d e t}+{\mathcal{L}}_{m a p}+{\mathcal{L}}_{m o t i o n}+{\mathcal{L}}_{p ...
国内外车企智驾方案对比
2025-06-23 02:09
国内外车企智驾方案对比 20250622 摘要 多家车企加速 L3 级智能驾驶研发,特斯拉在北美已实现完全一体式端到 端方案,国内仍采用模块化方案。华为预计下半年推送一体式端到端方 案,采用多传感器融合路线,比特斯拉更复杂。 下一代视觉语言行动(VLA)模型成为发展重点,参数量预计在 100 亿 以内,旨在通过图像数据直接输出动作,并加入大语言模型解释复杂场 景,目前国内车企多处于研发阶段。 特斯拉采用纯视觉方案,依赖 8 个摄像头实现智能辅助驾驶。其他车企 如华为、Momenta 和小鹏采用多传感器融合路线,但长期震动可能导 致激光雷达精度下降,需要算法补偿。 理想汽车结合 VLA 与端到端模型,使用两片 ORVIS 芯片分别处理场景 理解与复杂情况反馈,但 VRM 模型推理速度较慢。小鹏汽车通过改进 阿里千问的大语言模型进行预训练和后训练。 多数车企放弃高清地图,转而采购精度介于高清地图和传统导航地图之 间的地图。特斯拉领先世界生成技术,模拟多视角镜头并主动标注语义 信息,用于后续训练。 各智驾企业具体技术方案有哪些特点? 特斯拉目前领先,实现完全一体式纯视觉的自动驾驶,但国内采用模块化以适 应交通规则。 ...
隐式端到端VLA有哪些方法?领域一般是怎么分类的?
具身智能之心· 2025-06-22 14:47
1)视觉特征提取模块 (V) 隐式端到端VLA模型指的是没有明确生成了未来机械臂如何运动的图像。和显示、分层VLA方法有所不同,隐 式端到端VLA基础模块主要包含视觉特征提取模块(V)、视觉语言的联合特征学习(V+L)、视觉语言动作的 联合训练(V+L+A)。 3) 视觉语言动作的联合训练 (V+L+A) 通常情况: ResNet-18 2. 预训练模型: R3M, VC-1, Voltron, Theia 追求速度: Efficienet 为了和文本好对齐: CLIP 为了用大模型: CLIP, SigLIP 这就是端到端VLA要做的事情,不过可以给大家一个直观的感受!对于机器人任务如何得到VL--A的映射呢?找 到V中对action 有用的区域。 2)视觉语言的联合特征学习(V+L) 对于机器人任务如何处理同时处理视觉和文本信息呢?小模型的选择:FiLM,同时也可以依旧用Perceiver结 构。大模型的选择:MLLM基座(Paligemma )。 4)隐式端到端VLA怎么分类? 根据模型大小:大模型/小模型VLA; 根据架构差异:Transformer-based/Diffusion-based; 5) ...
自动驾驶端到端VLA落地,算法如何设计?
自动驾驶之心· 2025-06-22 14:09
点击下方 卡片 ,关注" 自动驾驶之心 "公众号 戳我-> 领取 自动驾驶近15个 方向 学习 路线 写在前面 自UniAD(CVPR 2023 Best Paper)问世以来,端到端已经成为当下量产的主流范式。而从去年下半年开始,尤 其是DeepSeek思维链流行以来,视觉-语言-动作(VLA)相关方法伴随着具身智能的爆火,相关论文已经横扫自 动驾驶前沿领域。同时各家主机厂也争先恐后尝试落地研发,理想、文远知行、小米、小鹏等等都在大力尝试量 产。 随着2025年即将过半,学术界和工业界也出现了很多优秀的工作。 所以哪些高质量工作现在应该格外关注?趋势在往什么方向发展?量产应用究竟如何?全都是值得每一位前沿从 业者思考~ 为此,自动驾驶之心采访了学术界和工业界第一线的大佬并做了VLA相关工作的汇总,文章按照发表时间排 序,其中不乏全球顶尖高校团队和工业界研究团队的工作。 并在文末做了一些对当下工作的观点整理,感兴趣 的小伙伴不要错过呦~ 标题:AutoVLA: A Vision-Language-Action Model for End-to-End Autonomous Driving with Adapt ...
商汤绝影世界模型负责人离职。。。
自动驾驶之心· 2025-06-21 13:15
Core Viewpoint - The article discusses the challenges and opportunities faced by SenseTime's autonomous driving division, particularly focusing on the competitive landscape and the importance of technological advancements in the industry. Group 1: Company Developments - The head of the world model development for SenseTime's autonomous driving division has left the company, which raises concerns about the future of their cloud technology system and the R-UniAD generative driving solution [2][3]. - SenseTime's autonomous driving division has successfully delivered a mid-tier solution based on the J6M model to GAC Trumpchi, but the mid-tier market is expected to undergo significant upgrades this year [4]. Group 2: Market Dynamics - The mid-tier market will see a shift from highway-based NOA (Navigation on Autopilot) to full urban NOA, which represents a major change in the competitive landscape [4]. - Leading companies are introducing lightweight urban NOA solutions based on high-tier algorithms, targeting chips with around 100 TOPS computing power, which are already being demonstrated to OEM clients [4]. Group 3: High-Tier Strategy - The key focus for SenseTime this year is the one-stage end-to-end solution, which has shown impressive performance and is a requirement for high-tier project tenders from OEMs [5]. - Collaborations with Dongfeng Motor aim for mass production and delivery of the UniAD one-stage end-to-end solution by Q4 2025, marking a critical opportunity for SenseTime to establish a foothold in the high-tier market [5][6]. Group 4: Competitive Landscape - SenseTime's ability to deliver a benchmark project in the high-tier segment is crucial for gaining credibility with OEMs and securing additional projects [6][7]. - The current window of opportunity for SenseTime in the high-tier market is limited, as many models capable of supporting high-tier software and hardware costs are being released this year [6][8].