VLA
Search documents
成本仅2k!完成各类VLA任务的复现
具身智能之心· 2026-01-09 00:55
点击下方 卡片 ,关注" 具身智能 之心 "公众号 编辑丨具身智能之心 本文只做学术分享,如有侵权,联系删文 >> 点击进入→ 具身智能之心 技术交流群 更多干货,欢迎加入国内首个具身智能全栈学习社区 : 具身智能之心知识星球 (戳我) , 这里包含所有你想要 的。 最近,不少同学想要复现各类vla任务,但苦于"成本太高"一直吐槽。 "能用"的机械臂基本要1.5w以上,加上相机等传感器价格不菲。对很多自学或者没有设备的同学来说是个硬 伤。 开源的低成本机械臂可以用吗? 可以是可以,但大多数初学者"调不出"效果。数据采不好,效果训不出,action总感觉很奇怪。 一些同学相当多的时间"浪费"在踩坑上了。 很多同学想低成本完成各类vla任务,预算不够也能入坑。 这一点,我们做到了! 具身智能之心基于SO-100和LeRobot复现了ACT、GR00T、π0、π0.5等方法,为大家解决缺乏真机、真机昂 贵、不知道如何上手的问题。 满满的VLA实战教程来啦! 对于更新较快的技术路线,如何有效学习VLA难倒了相当多的同学,很多人即使手上拿着真机,也不知道 如何使用。具身智能之心作为国内优质的具身内容制作平台,联合业内具 ...
随到随学!端到端与VLA自动驾驶小班课(视频+答疑)
自动驾驶之心· 2026-01-08 05:58
Jason, C9本科+QS50 PhD,已发表CCF-A论文2篇,CCF-B论文若干。现任国内TOP主机厂算法专家,目前从事端到端、大模型、世界模型等前沿算法的 预研和量产,并已主持和完成多项自动驾驶感知和端到端算法的产品量产交付,拥有丰富的端到端算法研发和实战经验。 这门课程讲如何展开 第一章:端到端算法介绍 点击下方 卡片 ,关注" 自动驾驶之心 "公众号 戳我-> 领取 自动驾驶近30个 方向 学习 路线 端到端与VLA涉及的核心内容包括BEV感知、视觉语言模型VLM、扩散模型、强化学习等等。通过学习端到端与VLA自动驾驶,可以掌握学术界和工业 界最前沿的技术栈。 为此我们联合 工业界大佬 开展了这门《端到端与VLA自动驾驶小班课》正式结课啦,随到随学(视频+答疑)!课程包含二段式端到端与一段式端到端 前沿算法的细致讲解,基本上都是工业界和学术界的Baseline。 扫码报名!抢占课程名额 讲师介绍 第一章主要是针对端到端自动驾驶概括性的内容讲解,这一章老师会带大家盘一下端到端的发展历史,端到端这个概念是怎么来了,为什么从模块化的 方法发展到端到端。一段式、二段式再到现在的VLA范式,每一种范式都有哪 ...
开年收到了很多同学关于自驾方向选择的咨询......
自动驾驶之心· 2026-01-06 09:17
对于从事自动化和计算机的同学,建议搞深度学习,VLA、端到端、世界模型都是很好的方向,从入门、到 工作甚至读博都有很大空间。对于机械和车辆的同学,可以先学习传统PnC、3DGS这些方向。算力低、入手 简单。 剩下的就是一些方法论的提升了,多看论文多交流,慢慢形成自己的思考和idea。 对很多新人研究者,一个 好的idea需要踩很多次坑。如果你还是新人,不知道怎么入门,可以看看我们推出的论文辅导。 论文辅导上线了! 点击下方 卡片 ,关注" 自动驾驶之心 "公众号 戳我-> 领取 自动驾驶近30个 方向 学习 路线 元旦后,收到不少同学的咨询,很多都是计算机、车辆、自动化和机械方向的同学。 先看自驾一些前沿的方向,VLA、端到端、强化学习、3DGS和世界模型。以及一些相对没那么拥挤的赛道像 开集目标检测、OCC、few-shot/zero-shot。很多研一和大四的同学往往无从下手,刚开始深度学习都还不懂, 更别说跟进前沿的方向了。是传统动力学还是深度学习?哪些还有发论文的需求?需要什么样的学习路线? 如果您有任意论文发表需求,支持带课题/研究方向咨询,欢迎联系我们, 微信:paperguidance 提供的服 ...
对话李飞飞“00后”门徒陈源培:放弃华为“天才少年”百万年薪,创业对标马斯克破解机器人世界级难题
Sou Hu Cai Jing· 2026-01-05 03:33
搜狐科技《超级瓦力——对话具身智能50人》栏目第15期,对话灵初智能联合创始人陈源培。 划重点 1.VLA未必是终局,但现阶段效果最好。 2.无论合成数据还是仿真数据,都无法真正适配真实场景的复杂需求,最终还是要依赖真实数据,采集成本已做到马斯克团队的1/10。 3.中美模型差距没那么大,国内能追上,但中国的供应链和应用场景优势,美国短期难赶超。 出品|搜狐科技 作者|郑松毅 编辑|杨锦 当多数人还将00后视为"新生代"时,这个群体已在具身智能赛道扛起大旗。出生于2001年的灵初智能联合创始人陈源培,正是这股年轻势力的典型代表。 从华南理工土木调剂生跨界RoboMaster全国冠军,从北大杨耀东门下的学术探索者到斯坦福 "AI 教母" 李飞飞的门徒,再到拒绝华为 "天才少年" 邀约、 以最年轻 AI 创业者身份跻身福布斯榜单,陈源培的每一步都在突破边界。 这位00后少年凭借超越年龄的行业清醒,将目光锁定灵巧手核心技术,在这家"科学家密度最高" 的具身智能创企,其团队将真实数据采集成本降至马斯 克公司的 1/10,破解了行业数据瓶颈。公司更是剑指2026年百万小时级全球最大灵巧手操作数据集,力求打造具身智能领域 ...
搞过自驾的小伙伴,在其他领域还是很抢手
自动驾驶之心· 2025-12-31 00:31
Group 1 - The core viewpoint of the article highlights the competitive landscape of the autonomous driving industry, emphasizing the focus on technology, cost, and efficiency as key areas of competition this year [1] - The industry has seen a shift with many professionals transitioning to sectors like embodied AI and drones, while autonomous driving remains a mature AI field, making algorithm talents highly sought after [1][2] - Major technological directions in autonomous driving have converged this year, including end-to-end systems, VLA, world models, and reinforcement learning, with many midstream companies tackling challenges like OCC and multi-sensor fusion perception [3] Group 2 - The membership of the paid community focused on autonomous driving has officially surpassed 4,000, indicating a growing interest in the development of technology routes and job information [3] - The company expresses gratitude to its supporters and announces various benefits and discounts for the new year, encouraging continued efforts in the upcoming year [4]
万字长文,VLA的架构和模型还有什么痛点?
具身智能之心· 2025-12-30 01:11
点击下方 卡片 ,关注" 具身智能 之心 "公众号 编辑丨 具身智能之心 本文只做学术分享,如有侵权,联系删文 >> 点击进入→ 具身智能之心 技术交流群 更多干货,欢迎加入国内首个具身智能全栈学习社区 : 具身智能之心知识星球 (戳我) , 这里包含所有你想要的。 ★ 上次VLA模型+真机部署的圆桌受到了行业的一致好评。最近平台的同学也一直在整理对话的文稿,今天就为大家分享下第一部分" VLA的架构和模型 "相关内 容。 张强老师: 好,感谢主持人介绍,大家好,我是张强。我来自北京人形机器人中心,主要研究方向和研究背景都是在做人形机器人,大概从2021年开始做人形机器人。先后在 Fourier、GR-1 和 Embodied机器人,包括我们现在的天工平台上做了一些研究。我主要做的研究方向是运动控制,VLA 和一些基于人形机器人的世界模型和具身智 能大模型,希望大家关注我们的工作,然后今天也很高兴跟各位嘉宾。很高兴接受具身智能之心的邀请,很高兴跟各位嘉宾在一起讨论一下相关的问题,谢谢! 完整内容欢迎加入我们的具身社区获取: 具身智能之心知识星球 主持人: 好,那我们就正式开始,那么欢迎大家来到具身智能之心的圆 ...
为什么π系列对行业产生了这么大的影响?
具身智能之心· 2025-12-29 00:04
点击下方 卡片 ,关注" 具身智能 之心 "公众号 编辑丨具身智能之心 本文只做学术分享,如有侵权,联系删文 >> 点击进入→ 具身智能之心 技术交流群 更多干货,欢迎加入国内首个具身智能全栈学习社区 : 具身智能之心知识星球 (戳我) , 这里包含所有你想要的。 π 系列堪称 VLA 领域的里程碑,核心在于以持续技术突破引领生成式 AI 时代机器人学习范式,重塑行业应用逻辑。 2024.10 π0:首创 Flow Matching 连续动作轨迹预测,突破传统离散动作精度瓶颈,为精密制造、自动驾驶等场景提供毫米级操作基础; 其模型能力引领通用机器人从实验室走向工业制造、家庭服务等实景应用,成为 2025 年来业界众多 VLA 模型的核心参考。学会 π 系列 模型,即掌握 VLA 模型的核心根基,更能为科研创新、求职就业、工业落地赋能添翼。 不少公司基于pi系列搭建自己的真机demo,比如叠衣服、拆箱子等,或基于这个思路改进优化。physical intelligence的每次新工作发布, 都会引起行业反响。 ★ 但pi貌似不"听话",不好调,总是达不到预期效果。这个事情,是很多同学持续在吐槽的。不少同学说,相 ...
搞过自驾的小伙伴,在其他领域还是很抢手
自动驾驶之心· 2025-12-28 03:30
自驾行业今年还是很精彩的,在整体下沉的关键节点,都很卷。卷技术、卷成本、卷效率。我们今年亦是如此,扩充了很多 B端的客户,也开始尝试从线上走向线下。C端也慢慢从普适性的能容逐渐专业化和精细化。 上半年不少自驾的同学转行去了具身,包括现在也是如此,L4/具身/无人机几个行业在大批量招人,而自驾又是相对成熟的 AI领域,所以自驾的算法人才非常受欢迎,几个头部企业的薪资很到位(大疆/宇树/智元/哈啰等等)。 下周就要迎来26年了,也到了年末盘点的时候。 搞过自驾的人,用过大集群,解过各种corner case,上下游协同能力强,这些都是其他几个行业所欠缺的。 今年,自驾的头部技术收敛到几个大方向上:一段式端到端、VLA、世界模型(重建+仿真)、强化学习。我们接触到的中 游厂商还在攻坚OCC、无图、多传感器融合感知等等,明年这些公司都有大量hc开放。 今年,自动驾驶之心的付费社区的成员正式突破4000人了。如果想看技术路线的发展、各类圆桌、研报、职位信息,可以多 来逛逛。 新的一年,也感谢新老粉丝的支持,我们为大家推出了众多福利优惠。新的一年大家再接再厉。 星球新人六折券,续费五折券 欢迎添加助理咨询活动 ...
收到很多同学关于自驾方向选择的咨询......
自动驾驶之心· 2025-12-26 09:18
对于从事自动化和计算机的同学,建议搞深度学习,VLA、端到端、世界模型都是很好的方向,从入门、到 工作甚至读博都有很大空间。对于机械和车辆的同学,可以先学习传统PnC、3DGS这些方向算力低、入手简 单。 剩下的就是一些方法论的提升了,多看论文多交流,慢慢形成自己的思考和idea。 对很多新人研究者,一个 好的idea需要踩很多次坑。如果你还是新人,不知道怎么入门,可以看看我们推出的论文辅导。 论文辅导上线了! 端到端、VLA、世界模型、强化学习、3D目标检测、多传感器融合、3DGS、BEV感知、Occupancy Network、多任务学习、语义分割、轨迹预测、运动规划、扩散模型、Flow matching、点云感知、毫米波雷 达、单目感知、车道线/在线高精地图等方向。 如果您有任意论文发表需求,支持带课题/研究方向咨询,欢迎联系我们, 微信:paperguidance 提供的服务 论文选题; 论文全流程指导; 实验指导; 点击下方 卡片 ,关注" 自动驾驶之心 "公众号 戳我-> 领取 自动驾驶近30个 方向 学习 路线 最近收到不少同学的咨询,很多都是计算机、车辆、自动化和机械方向的同学。 先看自驾一些 ...
冷静看待VLA:不是救世主,也不是“垃圾”
自动驾驶之心· 2025-12-26 09:18
作者 | 郑纯然Range 编辑 | 自动驾驶之心 原文链接: https://zhuanlan.zhihu.com/p/1921620079314961855 点击下方 卡片 ,关注" 自动驾驶之心 "公众号 戳我-> 领取 自动驾驶近30个 方向 学习 路线 >>自动驾驶前沿信息获取 → 自动驾驶之心知识星球 本文只做学术分享,如有侵权,联系删文 它并不完全是黑盒,最近NVIDIA有个工作CoT-VLA,就主要展示了VLA思维链并拆分为三层: 和人的思考模式真挺像的。 真正的挑战在于让模型学会泛化。 在遮挡/复杂背景/3D空间中的表现,关键是要把subgoal embedding设计好来保证泛化性。要保证subgoal embedding具有: 例如用cross-attention: 任务文本token attend到图像patch token,上面4条都能保证,可能效果就不错。 说不定,learning方法在复杂环境下反而更有优势。 昨晚睡前刷到一篇批判VLA的帖子,说"有些搞VLA公司又懒又蠢... (此处省略2000个字)",全篇非常犀利,我整理了下弗雷哥 (答主) 说的几个槽点: 肯定不能全盘否定 ...