端到端 - filings, earnings calls, financial reports, news

点击下方卡片，关注" 自动驾驶之心 "公众号戳我-> 领取自动驾驶近15个方向学习路线 >>自动驾驶前沿信息获取 → 自动驾驶之心知识星球 CVPR2025 WOD纯视觉端到端比赛放榜了，给大家分享下前三名的技术方案！太长不看版：冠军：来自EPFL团队，参考DiffusionDrive，用了nuPlan的数据 + ensembling 的策略；亚军：Nvidia & Tubingen团队，参考DiffusionDrive 和 SmartRefine，使用CARLA、NaviSim, WOD-P, WOD-E2E 等 4 个数据集，实验对比了不同阶段用不同数据训练的效果，证明训练数据循序的重要性（实验也用了 ensembling策略，有提升但不多）：pre-training可以多但质量差一些的数据，post-trainig 得用高质量的数据季军：韩国汉阳大学团队，主打一个结构简洁，输入只用前视图+自车状态，最后用一个 trajectory-decoder 输出结果特别奖：值得一提是这个特别奖，使用QWen2.5-VL，用 72B 的模型生成 CoT数据，最后在 3B 模型上训练~ 特别 ...

端到端算法

Autos

自动驾驶算法

具身智能之心· 2025-06-25 08:24

什么是显示端到端VLA，提到显示，这一点和隐式是对立的。上一期分享，我们分享了隐式端到端的模型定义，显示端到端VLA模型视频生成GOAL，明确生成了未来机械臂如何运动的图像！可以浏览下图！其中还涉及了一个比较重要的概念：逆运动学。逆运动学逆运动学主要应用在机器人学、动画学和计算机图形学中，与经典运动学相对。它的目标是根据目标位置，计算物体（如机械臂或骨骼系统）的各个关节应该如何运动才能到达该目标。列入在机器人领域，逆运动学会回答这样的实际问题：机械臂的末端（手爪）需要到达某个指定位置，那么每个关节应该如何旋转。逆运动学的核心步骤：已知信息：求解：利用矩阵、三角学或迭代方法，计算每个关节的角度或未知，使得末端能够到达目标点。多解性问题：逆运动学通用会有多个解（甚至没解），需要在可能的解中选择一个最优解（如最小能量消耗或最自然运动）。主要工作一览 3）LAPA 1）开山之作：UniPi 将序列决策问题转化为文本条件视频生成问题：给定文本编码的目标描述，规划器会合成一组未来帧来描绘其计划执行的行动序列，随后从生成的视频中提取控制动作。通过以文本作为底层目标描述，我们能够自然而然地实 ...

酷赛港股IPO：竞争激烈的智能手机市场及地缘政治风险

Jin Rong Jie· 2025-06-25 04:11

然而，酷赛也面临着显著的风险与挑战。首先，地缘政治紧张局势特别是美中关税争端可能对公司业务产生重大不利影响。2025年美国曾将来自中国的进口商品关税提高至145.0%，尽管后来降至30.0%，但若90天停战期后无法达成全面协议，可能导致关税再度升级，影响贸易稳定性。其次，酷赛经营所在的智能手机行业竞争极为激烈。全球智能手机端到端解决方案提供商市场主要集中于中国，公司若无法有效应对市场变化和客户偏好，其竞争力可能下降，业务扩张和盈利能力也将受到限制。本文源自：金融界作者：智研 6月25日，酷赛智能科技股份有限公司（以下简称"酷赛"）向港交所提交上市申请书，独家保荐人为中信证券（香港）有限公司。酷赛是全球领先的智能科技企业，提供包括产品定义、研发、供应链管理、制造和售后服务的全方位一站式解决方案。作为本土品牌背后的赋能者，酷赛主要向全球本土品牌和电信运营商提供消费类智能手机、三防手机以及其他物联网产品。根据弗若斯特沙利文数据，于2024年，按出货量计算，酷赛是全球第二大面向本土智能手机品牌的端到端解决方案提供商；于2025年第一季度，已升至榜首。凭借独到的智能硬件产品定义能力，酷赛能够根 ...

华为车BU招聘（端到端/感知模型/模型优化等）！岗位多多~

自动驾驶之心· 2025-06-24 07:21

点击下方卡片，关注" 自动驾驶之心 "公众号戳我-> 领取自动驾驶近15个方向学习路线华为车bu（引望）社招：端到端模型算法工程师 1. 承担端到端模型的设计、开发、部署和迭代感知模型算法工程师 1. 承担视觉感知相关的神经网络设计、开发、部署和迭代 4. 承担视觉感知算法的长期研发和迭代人脸状态监测算法工程师 1. 负责智能驾驶系统，驾驶员和乘客姿态，行为和视线监测算法研发和部署 2. 针对现网问题和用户新需求，快速设计算法方案，解决问题满足客户需求 3. 结合业界算法前沿，推动算法优化迭代，确保算法业界竞争力领先模型效率优化 1. 承担智能驾驶系统AI模型车端推理效率优化 2. 针对现网问题，优化迭代效率和方案；加速问题解决 3. 结合业界前沿和实际应用问题，推动新算法预研和落地 4. 分析端到端数据分布，均衡和调优 2. 构建AI模型压缩核心算法，设计和构建硬件亲和的模型稀疏、剪枝、蒸馏、量化等压缩能力 3. 紧跟业界前沿模型压缩方案，结合AI模型不断提升模型时延、内存带宽等指标~ 欢迎感兴趣的朋友加入自动驾驶之心知识星球获取联系方式，内部独家招聘信息，简历直达！！！前面一直在 ...

端到端系列！SpareDrive：基于稀疏场景表示的端到端自动驾驶~

自动驾驶之心· 2025-06-23 11:34

本文认为现有的端到端方法主要存在两个问题：一个是BEV范式下的方法非常耗算力；另一个是预测和planning串联式的方式不够好,场景信息是在 agent周围提取，忽略了自车。并且运动预测和规划都是多模态问题。基于此，本文提出一种Sparse范式下的端到端方法，且预测和planning并行。 Contribution: SparseDrive的主体结构沿用了之前地平线Sparse系列的思想：点击下方卡片，关注" 自动驾驶之心 "公众号戳我-> 领取自动驾驶近15个方向学习路线探索了端到端自动驾驶的稀疏场景表示，并提出了一种以稀疏为中心的范式；修改了运动预测和规划之间的巨大相似性，提出了一种分层规划选择策略； nuScenes 上 SOTA。特征提取；对称稀疏感知；平行运动规划器；训练的损失函数如下： SparseDrive: 损失函数 www.zdjszx.com □ Loss $${\mathcal{L}}={\mathcal{L}}_{d e t}+{\mathcal{L}}_{m a p}+{\mathcal{L}}_{m o t i o n}+{\mathcal{L}}_{p ...

端到端自动驾驶

Autos

SparseDrive

《面向工业级的端到端自动驾驶算法与实战》课程

端到端自动驾驶

Autos

SparseDrive

《面向工业级的端到端自动驾驶算法与实战》课程

国内外车企智驾方案对比

2025-06-23 02:09

国内外车企智驾方案对比 20250622 摘要多家车企加速 L3 级智能驾驶研发，特斯拉在北美已实现完全一体式端到端方案，国内仍采用模块化方案。华为预计下半年推送一体式端到端方案，采用多传感器融合路线，比特斯拉更复杂。下一代视觉语言行动（VLA）模型成为发展重点，参数量预计在 100 亿以内，旨在通过图像数据直接输出动作，并加入大语言模型解释复杂场景，目前国内车企多处于研发阶段。特斯拉采用纯视觉方案，依赖 8 个摄像头实现智能辅助驾驶。其他车企如华为、Momenta 和小鹏采用多传感器融合路线，但长期震动可能导致激光雷达精度下降，需要算法补偿。理想汽车结合 VLA 与端到端模型，使用两片 ORVIS 芯片分别处理场景理解与复杂情况反馈，但 VRM 模型推理速度较慢。小鹏汽车通过改进阿里千问的大语言模型进行预训练和后训练。多数车企放弃高清地图，转而采购精度介于高清地图和传统导航地图之间的地图。特斯拉领先世界生成技术，模拟多视角镜头并主动标注语义信息，用于后续训练。各智驾企业具体技术方案有哪些特点？特斯拉目前领先，实现完全一体式纯视觉的自动驾驶，但国内采用模块化以适应交通规则。 ...

隐式端到端VLA有哪些方法？领域一般是怎么分类的？

具身智能之心· 2025-06-22 14:47

1）视觉特征提取模块 (V) 隐式端到端VLA模型指的是没有明确生成了未来机械臂如何运动的图像。和显示、分层VLA方法有所不同，隐式端到端VLA基础模块主要包含视觉特征提取模块（V）、视觉语言的联合特征学习（V+L）、视觉语言动作的联合训练（V+L+A）。 3) 视觉语言动作的联合训练 (V+L+A) 通常情况: ResNet-18 2. 预训练模型: R3M, VC-1, Voltron, Theia 追求速度: Efficienet 为了和文本好对齐: CLIP 为了用大模型： CLIP， SigLIP 这就是端到端VLA要做的事情，不过可以给大家一个直观的感受！对于机器人任务如何得到VL--A的映射呢？找到V中对action 有用的区域。 2）视觉语言的联合特征学习（V+L）对于机器人任务如何处理同时处理视觉和文本信息呢？小模型的选择：FiLM，同时也可以依旧用Perceiver结构。大模型的选择：MLLM基座（Paligemma ）。 4）隐式端到端VLA怎么分类？根据模型大小：大模型/小模型VLA；根据架构差异：Transformer-based/Diffusion-based； 5） ...

自动驾驶之心· 2025-06-22 14:09

点击下方卡片，关注" 自动驾驶之心 "公众号戳我-> 领取自动驾驶近15个方向学习路线写在前面自UniAD（CVPR 2023 Best Paper）问世以来，端到端已经成为当下量产的主流范式。而从去年下半年开始，尤其是DeepSeek思维链流行以来，视觉-语言-动作（VLA）相关方法伴随着具身智能的爆火，相关论文已经横扫自动驾驶前沿领域。同时各家主机厂也争先恐后尝试落地研发，理想、文远知行、小米、小鹏等等都在大力尝试量产。随着2025年即将过半，学术界和工业界也出现了很多优秀的工作。所以哪些高质量工作现在应该格外关注？趋势在往什么方向发展？量产应用究竟如何？全都是值得每一位前沿从业者思考~ 为此，自动驾驶之心采访了学术界和工业界第一线的大佬并做了VLA相关工作的汇总，文章按照发表时间排序，其中不乏全球顶尖高校团队和工业界研究团队的工作。并在文末做了一些对当下工作的观点整理，感兴趣的小伙伴不要错过呦~ 标题：AutoVLA: A Vision-Language-Action Model for End-to-End Autonomous Driving with Adapt ...

自动驾驶之心· 2025-06-21 13:15

Core Viewpoint - The article discusses the challenges and opportunities faced by SenseTime's autonomous driving division, particularly focusing on the competitive landscape and the importance of technological advancements in the industry. Group 1: Company Developments - The head of the world model development for SenseTime's autonomous driving division has left the company, which raises concerns about the future of their cloud technology system and the R-UniAD generative driving solution [2][3]. - SenseTime's autonomous driving division has successfully delivered a mid-tier solution based on the J6M model to GAC Trumpchi, but the mid-tier market is expected to undergo significant upgrades this year [4]. Group 2: Market Dynamics - The mid-tier market will see a shift from highway-based NOA (Navigation on Autopilot) to full urban NOA, which represents a major change in the competitive landscape [4]. - Leading companies are introducing lightweight urban NOA solutions based on high-tier algorithms, targeting chips with around 100 TOPS computing power, which are already being demonstrated to OEM clients [4]. Group 3: High-Tier Strategy - The key focus for SenseTime this year is the one-stage end-to-end solution, which has shown impressive performance and is a requirement for high-tier project tenders from OEMs [5]. - Collaborations with Dongfeng Motor aim for mass production and delivery of the UniAD one-stage end-to-end solution by Q4 2025, marking a critical opportunity for SenseTime to establish a foothold in the high-tier market [5][6]. Group 4: Competitive Landscape - SenseTime's ability to deliver a benchmark project in the high-tier segment is crucial for gaining credibility with OEMs and securing additional projects [6][7]. - The current window of opportunity for SenseTime in the high-tier market is limited, as many models capable of supporting high-tier software and hardware costs are being released this year [6][8].