VLA端到端基础模型G0

Search documents
专访星海图赵行:热闹的Demo不等于泛化能力,具身智能胜负仍在数据量
36氪· 2025-08-13 13:35
以下文章来源于智能涌现 ,作者富充 智能涌现 . 直击AI新时代下涌现的产业革命。36氪旗下账号。 过去十个月中,G0模型的开发成为赵行和团队的重要工作。比起适合展示的小模型,他更希望做出有泛化性的具身智能大模型。 文 | 富充 编辑 | 苏建勋 来源| 智能涌现(ID:AIEmergence) 封面来源 | 采访人提供 人头攒动的2025WRC(世界机器人大会)上,不乏各种酷炫的Demo展示,可在一众敲锣打鼓的机器人表演中,具身智能公司星海图展位上,机器人却在安 静地执行铺床任务。 一些围观者流露出疑惑的表情。他们难以理解,为何这个对人类来说极其简单的工作,需要大费周章地展示。 看似简单的工作,机器人却调用了全身23个自由度,往往要分三步实现:它先通过底盘移动至最佳作业位;随后升降、俯仰躯干,调整合适的工作角度;最 后用机械臂抓住被子,外拉、展平。 三个步骤间也相互影响:机器人如果一开始没走到位,就会抓不住被子;即使走到位,如果被子在床很中间的位置,躯干就得特别往前倾去"够"到;抓取 时,由于被子较重,不能仅靠臂拉动时,机器人还要通过全身位移去拉平。 这场演示的背后,是星海图新发布的 VLA(Vision- ...
专访星海图赵行:热闹的Demo不等于泛化能力,具身智能胜负仍在数据量
3 6 Ke· 2025-08-13 03:37
文:富充 人头攒动的2025WRC(世界机器人大会)上,不乏各种酷炫的Demo展示,可在一众敲锣打鼓的机器人表演中,具身智能公司星海图展位上,机器人却在 安静地执行铺床任务。 一些围观者流露出疑惑的表情。他们难以理解,为何这个对人类来说极其简单的工作,需要大费周章地展示。 "铺床是个集各种难度于一身的长程任务。考验了机器人柔性物体操作、模型的全身控制等能力,以及在各种杂乱床面上完成整理的泛化性。"星海图首席 科学家、清华交叉信息学院助理教授赵行在展会现场对《智能涌现》说。 这时,工作人员将被子随机弄乱,一位观众下达了铺床的指令,机器人随即开始工作。 看似简单的工作,机器人却调用了全身23个自由度,往往要分三步实现:它先通过底盘移动至最佳作业位;随后升降、俯仰躯干,调整合适的工作角度; 最后用机械臂抓住被子,外拉、展平。 三个步骤间也相互影响:机器人如果一开始没走到位,就会抓不住被子;即使走到位,如果被子在床很中间的位置,躯干就得特别往前倾去"够"到;抓取 时,由于被子较重,不能仅靠臂拉动时,机器人还要通过全身位移去拉平。 这场演示的背后,是星海图新发布的 VLA(Vision-Language-Action, ...