Workflow
TransDiffuser
icon
Search documents
理想一篇论文入选近半年端到端自动驾驶推荐度最高的10篇论文
理想TOP2· 2025-06-18 11:43
以下文章来源于深蓝AI ,作者深蓝学院 深蓝AI . 专注于人工智能、机器人与自动驾驶的学习平台。 近半年端到端自动驾驶推荐度最高的10篇论文,是由深蓝AI调研了数十位自动驾驶一线研究者后得出的。 深蓝AI自己的定位是人工智能、机器人与自动驾驶的学习平台,受众是相关的技术从业人员。 原标题是" 盘点|近半年「端到端自动驾驶」推荐度最高的10篇论文 ",并没有带理想,这10篇论文本身也是去中心化排列的,不存在理想公关的 部分。 TOP2非常明显得感知到过去一年,理想在面向自动驾驶从业群体的号的存在感越来越强,甚至可以说,如果是面向母语为中文的自动驾驶从业群 体的号,在过去一年,已经不可能不多发几篇理想的内容。目前理想在面向AI从业群体的号的存在感,还不算特别强,还是有不少AI号主对理想做 AI感知不强。 额外提醒读者留意3点: 1. 李想在24Q4电话会议上比喻端到端是猴子开车,VLM是副驾的人类,给猴子一些指令,VLA是主驾就是人类在开车。即我们合情预期,VLA的 拟人感可以明显比VLM上一个台阶。 从技术架构来说,VLM是两个系统,系统1本质是通过模仿学习的方式端出轨迹,不具备任何语意理解的能力。(对应猴子 ...
TransDiffuser: 理想VLA diffusion出轨迹的架构
理想TOP2· 2025-05-18 13:08
Diffusion(扩散模型)是一种生成数据的模型,除了Diffusion外,还有其他生成模型,比如GAN(生成对 抗网络)、VAE(变分自编码器)等。不同的生成模型在核心思想与生成数据的方法上有区别。 Diffusion的核心思想是通过加噪声(Forward Process)和去噪(Reverse Process)的过程来学习数据的分 布。可以想象成一种逆向拼图: 先把一张完整的图片或其他数据打乱成一片模糊,再通过学习如何一 步步还原它。 去噪的过程是训练一个神经网络,让它去预测每一步的噪声,然后去除噪声,生成目标数据。 贾鹏25年3月英伟达GTC上关于理想VLA diffusion出轨迹的表述 VLM是由端到端+VLM两个模型组成的,VLM的两个快慢系统都是输出的轨迹。VLA是一个模型具 备快慢思考能力。 读者不用被里面的名词吓着,本文经过认真思考,并结合预期的大多数读者的知识储备,做了不少专 门解释,逻辑链很清晰,多读几遍能有收获的。 本文结构:先解释什么是Diffusion,再分享贾鹏25年3月英伟达GTC上关于理想VLA diffusion出轨迹 的表述,最后分享TransDiffuser的架构细节 ...