端到端

Search documents
极氪智驾团队夺冠CVPR国际比赛,解决端到端AI模型训练世界级难题
news flash· 2025-06-30 08:08
近日,在国际顶级CVPR 2025自动驾驶研讨会上,Argoverse2 2025场景挖掘挑战赛结果揭晓,中国极氪 智驾团队拔得头筹。极氪智驾团队用AI技术解决全球自动驾驶领域公认的技术挑战,从海量、高度冗 余的数据中,快速定位并提取对系统安全与体验的关键驾驶场景。在同数据量中,极氪智驾AI模型可 获得更优学习成果,在实际应用中提升端到端系统在关键驾驶场景的识别和处理能力。(全天候科技) ...
电动化及智能化专家交流
2025-06-30 01:02
电动化及智能化专家交流 20260629 摘要 特斯拉 Robotaxi 采用端到端深度神经网络,虽有抖动问题,但整体体 验良好,且成本低于高清地图方案。工程团队热情高涨,预示进展可能 超预期,但完全无人交付难度高于 Robotaxi,需 AI 自主应对所有问题, 短期内难大规模铺开。 小米 SU7 在产品定义上与主流产品差异不大,优势在于搭载车规级骁龙 8 Gen 3 芯片,成本降低且性能优于现有车规芯片;深化"人车家战 略",整合米家生态链配件,主机厂身份参与汽车后市场,或成标准制 定者。 特斯拉 Robotaxi 对海外订单促进作用不明显,中国市场影响难追溯。 自动驾驶和机器人技术虽宣称同源,但实际操作中存在差异。Ashok 监 管后,机器人深度神经网络预计更大程度转向端到端或与 FSD 同源,但 仍需大量特定开发。 小米汽车成功依赖独特设计、产品定义和品牌影响力,人车家战略和消 费电子芯片优势尚未完全体现。长期来看,复用米家生态链是其显著差 异化优势,能以主机厂身份有效进入汽车后市场配件领域。 Q&A 特斯拉 Robotaxi 在首次试运营中表现如何,其技术路线和团队状态有何特点? 特斯拉完全无人交付 ...
不用给理想入选ICCV高评价, 牛的是理想的工作, 不是ICCV
理想TOP2· 2025-06-29 15:06
本文结构: 先介绍AI学术圈为什么很多特点与其他学科不一样,引入能发多篇顶会的中国公司其实蛮多的,含金量并不高。这块我很懂, 我上一段创业 受众就是ICCV/CVPR/AAAI/ICLR的投稿者。 再详细论述理想VLA的原始创新度是DeepSeek MoE级别,没有跟随特斯拉了(VLM之后就不是跟随了,是深度参考),并指出原始创新度低于DeepSeek的 MLA,MLA原始创新度低于Transformer。 目前有能力做出MoE级别原始创新的中国公司很少,这块很有含金量。 以下为正文: 25年6月27日,理想自动驾驶负责人表示自动驾驶团队5篇论文中稿ICCV,VLA交付后会把"梯队"拿掉。 李想补充到,理想基座模型团队还有三篇论文被录用,在措辞上对入选ICCV给予了很高评价。 TOP2上一段创业经历受众就是AAAI/ICML/NeurIPS/ICLR/CVPR/ICCV这些顶会的投稿者,所以TOP2对这块特别懂。 AI学术圈与其他学科圈特点有非常多不同 AI学术圈会议比期刊重要 ,本质原因是,AI学术发展速度太快,而期刊审稿周期太长,旧有的以期刊为中心的学术共同体范式难以满足AI学术圈的发展 需求。 AI会议 ...
当下自动驾驶的技术发展,重建还有哪些应用?
自动驾驶之心· 2025-06-29 08:19
点击下方 卡片 ,关注" 自动驾驶之心 "公众号 戳我-> 领取 自动驾驶近15个 方向 学习 路线 4D标注之静态元素 这些天一直在思考一个问题:当下自动驾驶的技术发展,重建还有哪些应用? 起因是身边做SLAM的小伙伴抱怨现在工作都找不到,SLAM的职业发展空间正在逐渐缩小。而且当下自动驾驶所需要的重建也在向前发展,不再是SLAM相关的技术 栈了。。。 回到问题本身,重建当下在4D标注 - 静态元素上的应用还是很广的,当然核心技术不再局限在SLAM上。车道线及静态障碍物标注,还是强依赖在重建图上标注的~2D 空间标注,每个时间戳下都需要再图像上进行标注,模型做语义分割+深度预测,这种方式耗时费力,实时上,只需要重建出3D静态场景,在重建3D场景中静态元素 只需标注一次。 重建的目的主要有两个: 输入:根据lidar或者多个周视摄像头重建得到的3D重建图 输出:矢量车道线及类别,单条车道线用多个有序点表示组成折线,例如一条车道线为(N,3),其中N为车道线点的数量,3为xyz空间坐标值 获取地面重建图2D(BEV+高度)车道线和地面标识; 重建静态点云 3D(静态障碍物)。 在梳理下重建的整体流程,这里面涉及 ...
何恺明CVPR 2025报告深度解读:生成模型如何迈向端到端?
自动驾驶之心· 2025-06-28 13:34
点击下方 卡片 ,关注" 大模型之心Tech "公众号 戳我 -> 领取大模型巨卷干货 写在前面 在深度学习的历史长河中,AlexNet的横空出世曾彻底改写识别模型的命运——它让"逐层训练"成为过去式,端到端学 习从此一统江湖。而今天,当我们望向生成模型的浩瀚星空,扩散模型的多步迭代、自回归模型的时序依赖,是否仍 在重演"前AlexNet时代"的困局? 何恺明老师在 CVPR 2025 workshop上的最新分享 《Towards End-to-End Generative Modeling》 ,正以手术刀般的视 角剖开这场技术演进的历史轮回。他不仅回溯了识别与生成的"硬币双面"关系——一边是数据到语义的抽象流,一边 是噪声到实例的具象流,更带来了MeanFlow这把"瑞士军刀":用平均速度替代复杂积分,让ImageNet生成从250步迭 代压缩到1步完成,FID指标直逼传统多步模型的天花板。 这不禁让人思考:生成模型的"AlexNet时刻"是否已至? 今天,就让我们以何恺明老师的报告为锚点, 回顾 一下生成模型技术丛林的深度漫游,解锁那些正在重塑生成模型范 式的关键思想。 此外,借着这个话题,我们也同步 ...
技术、成本、规则,谁能撬动自动驾驶汽车落地
Jing Ji Guan Cha Wang· 2025-06-28 06:30
刘诚/文 人工智能的技术进步及其成本降低推动了DeepSeek等大模型的普及。那么,自动驾驶汽车呢?是否也可以通过技术、成本及社会规则的演进,迎来快速落 地的井喷时刻? 技术:从理想照进现实 技术创新是新事物发展的前提,也是根本动力。当前AI技术创新正在经历显著转变,从以内容生成为核心的生成式AI转向以目标驱动为核心的智能体AI。 我们预测,与ChatGPT、DeepSeek等模型在语言领域带来的跨越式进步类似,在不远的将来,智能体AI也将在自动驾驶领域呈现爆发式增长,实现感知、决 策与控制能力的重大突破,大量新车将会具有高级别辅助及完全的自动驾驶能力。 当前,汽车工业的智能化创新正在如火如荼地发生着。一些车企加速驶入具身智能人形机器人赛道,而抛开外形的"表面"创新不谈,自动驾驶技术本身有两 种技术走向。一种是"端到端"技术。它来自深度学习中的概念,英文为"End—to—End(E2E)",指通过一个AI模型,只要输入原始数据就可以输出最终结 果。应用到自动驾驶领域,这意味着只需要一个模型,就能把摄像头、毫米波雷达、激光雷达等传感器收集到的感知信息,转换成车辆方向盘的转动角度、 加速踏板的踩踏深度以及制动的力 ...
第一篇具身领域论文应该怎么展开?
具身智能之心· 2025-06-27 09:41
EI/中文核心/毕业论文/申博等 点击下方 卡片 ,关注" 具身智能 之心 "公众号 还在为论文选题抓耳挠腮?被数据建模折磨到头秃?面对导师批注手足无措?别慌!具身智能之心,资深导师团 队在线 "救援",一站式解决你的论文烦恼! 【前沿论文辅导重磅上线!多模态大模型/VLA/3D感知/数据生成/视觉语言导航/机器人导航/具身智能等顶会 方向1V1定制化辅导】 CCF-A到CCF-C SCI一区到四区 你是否正在研究以下前沿领域却苦于突破瓶颈? 多模态大模型(视觉-语言预训练、跨模态推理) 视觉语言动作(VLA)(端到端、分层等) 视觉语言导航(VLN)(Embodied QA、指令跟随、场景理解) 机器人抓取与导航(Sim2Real、强化学习、3D场景建模) 具身智能体泛化(跨任务迁移、零样本适应、仿真环境构建) 3D高斯泼溅(3DGS)(实时渲染、动态场景建模、SLAM结合) 端到端具身智能体(决策闭环、多模态传感器融合) 具身合成数据生成(自动标注、域适应、数据增强) 为什么选择我们? ✅ 顶会/顶刊导师团队:来自CMU、Stanford、MIT等名校的PhD及大厂研究员,覆盖ICRA、NeurIPS、C ...
商汤绝影世界模型负责人离职。。。
自动驾驶之心· 2025-06-27 09:15
据悉,商汤绝影的世界模型研发负责人离职。据了解其负责商汤绝影云端技术体系建设,也是绝影的生 成式智驾方案R-UniAD的研发负责人。 以下文章来源于红色星际 ,作者红色星际科技 红色星际 . 让更多人,更深入地了解自动驾驶行业! 来源 | 红色星际 点击下方 卡片 ,关注" 自动驾驶之心 "公众号 戳我-> 领取 自动驾驶近15个 方向 学习 路线 >>点击进入→ 自动驾驶之心 『行业第一线』技术交流群 本文只做学术分享,如有侵权,联系删文 传闻该负责人离职之后有可能去创业。 25年对于商汤绝影来说仍旧会是充满挑战的一年。 在中阶上,商汤绝影在广汽传祺上量产交付了基于J6M的中阶方案。不过,今年中阶市场将迎来升级迭 代,也就是基于J6M做出来城区NOA,从目前的高速NOA升级为全域NOA,这是今年中阶市场最大的变 化。 一些头部公司基于高阶方案的蒸馏剪裁推出了轻量版的城区NOA,下放到100 TOPS算力左右的芯片上, 而且已经给主机厂客户做推广演示。 这次算法方案的升级迭代也会改变中阶市场的格局。跟得上的玩家,将会继续留在牌桌上,而跟不上 的,就有可能被挤下来。 这是行业非常残酷的一面,算法方案每年一次迭代 ...
Robotaxi 商业化专家解读会
2025-06-26 14:09
Robotaxi 商业化专家解读会 20250625 摘要 初期 Robotaxi 运营表现与预期相符,技术水平与几年前 Pony.ai 等公 司相当,存在误入车道、违规掉头等问题,反映出 Robotaxi 技术仍处 于发展初期阶段。 Robotaxi 行业呈现稳中向好趋势,大型企业和主机厂陆续入局,预计 未来两三年是关键期,有望在部分区域实现盈亏平衡,宁德时代和蚂蚁 集团等公司的合作也印证了市场即将迎来繁荣。 Robotaxi 芯片正从英伟达 Orin X 向国产地平线征程 6 过渡,主要考量 在于打破垄断、降低成本和规避供应风险,预计未来两种芯片将共存, 地平线芯片搭载比例将大幅提升。 Robotaxi 算法训练大规模采用模型训练方式,小马智行和百度 Apollo 等公司已广泛采用类似于端到端的方式进行算法训练,短期内多段式方 案仍是 Robotaxi 的最优解。 国内 Robotaxi 单车在特定运营条件下(每日接 18 单,每单平均 5 公里, 车内无司机,后台安全员与车辆比例达到 1:5 以上),预计到 2026 年 基本能实现盈亏平衡(不考虑车辆折旧成本)。 Q&A 特斯拉 Robotaxi 于 ...
何恺明新身份:谷歌DeepMind杰出科学家
机器之心· 2025-06-26 00:30
机器之心报道 机器之心编辑部 恭喜谷歌。 刚刚,有网友爆料,自己在公司收到了「欢迎何恺明加入」的邮件,何恺明疑似加入谷歌。 在搜索何恺明个人主页后,我们可以确认,他确实加入了谷歌,不过是以兼职的形式,职位是谷歌 DeepMind 杰出科学家 (Distinguished Scientist)。 个人主页:https://people.csail.mit.edu/kaiming/ 关于何恺明在谷歌的具体研究方向,目前还搜不到详细信息。 不过,我们可以根据他最近发表的研究推测一下。前段时间,他所在的团队发布了一篇题为「Mean Flows for One-step Generative Modeling」的论文(参见《 何恺 明团队又发新作: MeanFlow 单步图像生成 SOTA,提升达 50% 》)。在最近的 CVPR workshop 上,他也重点介绍了这一论文所代表的方向。 在分享中,他指出,在 AlexNet 之前,逐层训练更为流行,如深度信念网络(DBN)和去噪自编码器(DAE)。但 AlexNet 之后,识别模型普遍实现了端到端训 练,大大简化了模型设计和训练的复杂性。 不过,有趣的是,今天的生成 ...