端到端 - filings, earnings calls, financial reports, news

端到端

Search documents

news flash· 2025-06-30 08:08

近日，在国际顶级CVPR 2025自动驾驶研讨会上，Argoverse2 2025场景挖掘挑战赛结果揭晓，中国极氪智驾团队拔得头筹。极氪智驾团队用AI技术解决全球自动驾驶领域公认的技术挑战，从海量、高度冗余的数据中，快速定位并提取对系统安全与体验的关键驾驶场景。在同数据量中，极氪智驾AI模型可获得更优学习成果，在实际应用中提升端到端系统在关键驾驶场景的识别和处理能力。（全天候科技） ...

2025-06-30 01:02

电动化及智能化专家交流 20260629 摘要特斯拉 Robotaxi 采用端到端深度神经网络，虽有抖动问题，但整体体验良好，且成本低于高清地图方案。工程团队热情高涨，预示进展可能超预期，但完全无人交付难度高于 Robotaxi，需 AI 自主应对所有问题，短期内难大规模铺开。小米 SU7 在产品定义上与主流产品差异不大，优势在于搭载车规级骁龙 8 Gen 3 芯片，成本降低且性能优于现有车规芯片；深化"人车家战略"，整合米家生态链配件，主机厂身份参与汽车后市场，或成标准制定者。特斯拉 Robotaxi 对海外订单促进作用不明显，中国市场影响难追溯。自动驾驶和机器人技术虽宣称同源，但实际操作中存在差异。Ashok 监管后，机器人深度神经网络预计更大程度转向端到端或与 FSD 同源，但仍需大量特定开发。小米汽车成功依赖独特设计、产品定义和品牌影响力，人车家战略和消费电子芯片优势尚未完全体现。长期来看，复用米家生态链是其显著差异化优势，能以主机厂身份有效进入汽车后市场配件领域。 Q&A 特斯拉 Robotaxi 在首次试运营中表现如何，其技术路线和团队状态有何特点？特斯拉完全无人交付 ...

不用给理想入选ICCV高评价, 牛的是理想的工作, 不是ICCV

理想TOP2· 2025-06-29 15:06

本文结构：先介绍AI学术圈为什么很多特点与其他学科不一样，引入能发多篇顶会的中国公司其实蛮多的，含金量并不高。这块我很懂, 我上一段创业受众就是ICCV/CVPR/AAAI/ICLR的投稿者。再详细论述理想VLA的原始创新度是DeepSeek MoE级别，没有跟随特斯拉了(VLM之后就不是跟随了，是深度参考)，并指出原始创新度低于DeepSeek的 MLA，MLA原始创新度低于Transformer。目前有能力做出MoE级别原始创新的中国公司很少，这块很有含金量。以下为正文： 25年6月27日，理想自动驾驶负责人表示自动驾驶团队5篇论文中稿ICCV，VLA交付后会把"梯队"拿掉。李想补充到，理想基座模型团队还有三篇论文被录用，在措辞上对入选ICCV给予了很高评价。 TOP2上一段创业经历受众就是AAAI/ICML/NeurIPS/ICLR/CVPR/ICCV这些顶会的投稿者，所以TOP2对这块特别懂。 AI学术圈与其他学科圈特点有非常多不同 AI学术圈会议比期刊重要，本质原因是，AI学术发展速度太快，而期刊审稿周期太长，旧有的以期刊为中心的学术共同体范式难以满足AI学术圈的发展需求。 AI会议 ...

当下自动驾驶的技术发展，重建还有哪些应用？

自动驾驶之心· 2025-06-29 08:19

点击下方卡片，关注" 自动驾驶之心 "公众号戳我-> 领取自动驾驶近15个方向学习路线 4D标注之静态元素这些天一直在思考一个问题：当下自动驾驶的技术发展，重建还有哪些应用？起因是身边做SLAM的小伙伴抱怨现在工作都找不到，SLAM的职业发展空间正在逐渐缩小。而且当下自动驾驶所需要的重建也在向前发展，不再是SLAM相关的技术栈了。。。回到问题本身，重建当下在4D标注 - 静态元素上的应用还是很广的，当然核心技术不再局限在SLAM上。车道线及静态障碍物标注，还是强依赖在重建图上标注的~2D 空间标注，每个时间戳下都需要再图像上进行标注，模型做语义分割+深度预测，这种方式耗时费力，实时上，只需要重建出3D静态场景，在重建3D场景中静态元素只需标注一次。重建的目的主要有两个：输入：根据lidar或者多个周视摄像头重建得到的3D重建图输出：矢量车道线及类别，单条车道线用多个有序点表示组成折线，例如一条车道线为（N,3），其中N为车道线点的数量，3为xyz空间坐标值获取地面重建图2D（BEV+高度）车道线和地面标识；重建静态点云 3D（静态障碍物）。在梳理下重建的整体流程，这里面涉及 ...

何恺明CVPR 2025报告深度解读：生成模型如何迈向端到端？

自动驾驶之心· 2025-06-28 13:34

点击下方卡片，关注" 大模型之心Tech "公众号戳我 -> 领取大模型巨卷干货写在前面在深度学习的历史长河中，AlexNet的横空出世曾彻底改写识别模型的命运——它让"逐层训练"成为过去式，端到端学习从此一统江湖。而今天，当我们望向生成模型的浩瀚星空，扩散模型的多步迭代、自回归模型的时序依赖，是否仍在重演"前AlexNet时代"的困局？何恺明老师在 CVPR 2025 workshop上的最新分享《Towards End-to-End Generative Modeling》，正以手术刀般的视角剖开这场技术演进的历史轮回。他不仅回溯了识别与生成的"硬币双面"关系——一边是数据到语义的抽象流，一边是噪声到实例的具象流，更带来了MeanFlow这把"瑞士军刀"：用平均速度替代复杂积分，让ImageNet生成从250步迭代压缩到1步完成，FID指标直逼传统多步模型的天花板。这不禁让人思考：生成模型的"AlexNet时刻"是否已至？今天，就让我们以何恺明老师的报告为锚点，回顾一下生成模型技术丛林的深度漫游，解锁那些正在重塑生成模型范式的关键思想。此外，借着这个话题，我们也同步 ...

技术、成本、规则，谁能撬动自动驾驶汽车落地

Jing Ji Guan Cha Wang· 2025-06-28 06:30

刘诚／文人工智能的技术进步及其成本降低推动了DeepSeek等大模型的普及。那么，自动驾驶汽车呢？是否也可以通过技术、成本及社会规则的演进，迎来快速落地的井喷时刻？技术：从理想照进现实技术创新是新事物发展的前提，也是根本动力。当前AI技术创新正在经历显著转变，从以内容生成为核心的生成式AI转向以目标驱动为核心的智能体AI。我们预测，与ChatGPT、DeepSeek等模型在语言领域带来的跨越式进步类似，在不远的将来，智能体AI也将在自动驾驶领域呈现爆发式增长，实现感知、决策与控制能力的重大突破，大量新车将会具有高级别辅助及完全的自动驾驶能力。当前，汽车工业的智能化创新正在如火如荼地发生着。一些车企加速驶入具身智能人形机器人赛道，而抛开外形的"表面"创新不谈，自动驾驶技术本身有两种技术走向。一种是"端到端"技术。它来自深度学习中的概念，英文为"End—to—End（E2E）"，指通过一个AI模型，只要输入原始数据就可以输出最终结果。应用到自动驾驶领域，这意味着只需要一个模型，就能把摄像头、毫米波雷达、激光雷达等传感器收集到的感知信息，转换成车辆方向盘的转动角度、加速踏板的踩踏深度以及制动的力 ...

具身智能之心· 2025-06-27 09:41

EI/中文核心/毕业论文/申博等点击下方卡片，关注" 具身智能之心 "公众号还在为论文选题抓耳挠腮？被数据建模折磨到头秃？面对导师批注手足无措？别慌！具身智能之心，资深导师团队在线 "救援"，一站式解决你的论文烦恼！【前沿论文辅导重磅上线！多模态大模型/VLA/3D感知/数据生成/视觉语言导航/机器人导航/具身智能等顶会方向1V1定制化辅导】 CCF-A到CCF-C SCI一区到四区你是否正在研究以下前沿领域却苦于突破瓶颈？多模态大模型（视觉-语言预训练、跨模态推理）视觉语言动作（VLA）（端到端、分层等）视觉语言导航（VLN）（Embodied QA、指令跟随、场景理解）机器人抓取与导航（Sim2Real、强化学习、3D场景建模）具身智能体泛化（跨任务迁移、零样本适应、仿真环境构建） 3D高斯泼溅（3DGS）（实时渲染、动态场景建模、SLAM结合）端到端具身智能体（决策闭环、多模态传感器融合）具身合成数据生成（自动标注、域适应、数据增强）为什么选择我们？ ✅ 顶会/顶刊导师团队：来自CMU、Stanford、MIT等名校的PhD及大厂研究员，覆盖ICRA、NeurIPS、C ...

自动驾驶之心· 2025-06-27 09:15

据悉，商汤绝影的世界模型研发负责人离职。据了解其负责商汤绝影云端技术体系建设，也是绝影的生成式智驾方案R-UniAD的研发负责人。以下文章来源于红色星际，作者红色星际科技红色星际 . 让更多人，更深入地了解自动驾驶行业！来源 | 红色星际点击下方卡片，关注" 自动驾驶之心 "公众号戳我-> 领取自动驾驶近15个方向学习路线 >>点击进入→ 自动驾驶之心『行业第一线』技术交流群本文只做学术分享，如有侵权，联系删文传闻该负责人离职之后有可能去创业。 25年对于商汤绝影来说仍旧会是充满挑战的一年。在中阶上，商汤绝影在广汽传祺上量产交付了基于J6M的中阶方案。不过，今年中阶市场将迎来升级迭代，也就是基于J6M做出来城区NOA，从目前的高速NOA升级为全域NOA，这是今年中阶市场最大的变化。一些头部公司基于高阶方案的蒸馏剪裁推出了轻量版的城区NOA，下放到100 TOPS算力左右的芯片上，而且已经给主机厂客户做推广演示。这次算法方案的升级迭代也会改变中阶市场的格局。跟得上的玩家，将会继续留在牌桌上，而跟不上的，就有可能被挤下来。这是行业非常残酷的一面，算法方案每年一次迭代 ...

2025-06-26 14:09

Robotaxi 商业化专家解读会 20250625 摘要初期 Robotaxi 运营表现与预期相符，技术水平与几年前 Pony.ai 等公司相当，存在误入车道、违规掉头等问题，反映出 Robotaxi 技术仍处于发展初期阶段。 Robotaxi 行业呈现稳中向好趋势，大型企业和主机厂陆续入局，预计未来两三年是关键期，有望在部分区域实现盈亏平衡，宁德时代和蚂蚁集团等公司的合作也印证了市场即将迎来繁荣。 Robotaxi 芯片正从英伟达 Orin X 向国产地平线征程 6 过渡，主要考量在于打破垄断、降低成本和规避供应风险，预计未来两种芯片将共存，地平线芯片搭载比例将大幅提升。 Robotaxi 算法训练大规模采用模型训练方式，小马智行和百度 Apollo 等公司已广泛采用类似于端到端的方式进行算法训练，短期内多段式方案仍是 Robotaxi 的最优解。国内 Robotaxi 单车在特定运营条件下（每日接 18 单，每单平均 5 公里，车内无司机，后台安全员与车辆比例达到 1:5 以上），预计到 2026 年基本能实现盈亏平衡（不考虑车辆折旧成本）。 Q&A 特斯拉 Robotaxi 于 ...

何恺明新身份：谷歌DeepMind杰出科学家

机器之心· 2025-06-26 00:30

机器之心报道机器之心编辑部恭喜谷歌。刚刚，有网友爆料，自己在公司收到了「欢迎何恺明加入」的邮件，何恺明疑似加入谷歌。在搜索何恺明个人主页后，我们可以确认，他确实加入了谷歌，不过是以兼职的形式，职位是谷歌 DeepMind 杰出科学家 (Distinguished Scientist)。个人主页：https://people.csail.mit.edu/kaiming/ 关于何恺明在谷歌的具体研究方向，目前还搜不到详细信息。不过，我们可以根据他最近发表的研究推测一下。前段时间，他所在的团队发布了一篇题为「Mean Flows for One-step Generative Modeling」的论文（参见《何恺明团队又发新作： MeanFlow 单步图像生成 SOTA，提升达 50% 》）。在最近的 CVPR workshop 上，他也重点介绍了这一论文所代表的方向。在分享中，他指出，在 AlexNet 之前，逐层训练更为流行，如深度信念网络（DBN）和去噪自编码器（DAE）。但 AlexNet 之后，识别模型普遍实现了端到端训练，大大简化了模型设计和训练的复杂性。不过，有趣的是，今天的生成 ...