Workflow
专访星海图赵行:热闹的Demo不等于泛化能力,具身智能胜负仍在数据量
3 6 Ke·2025-08-13 03:37

文:富充 人头攒动的2025WRC(世界机器人大会)上,不乏各种酷炫的Demo展示,可在一众敲锣打鼓的机器人表演中,具身智能公司星海图展位上,机器人却在 安静地执行铺床任务。 一些围观者流露出疑惑的表情。他们难以理解,为何这个对人类来说极其简单的工作,需要大费周章地展示。 "铺床是个集各种难度于一身的长程任务。考验了机器人柔性物体操作、模型的全身控制等能力,以及在各种杂乱床面上完成整理的泛化性。"星海图首席 科学家、清华交叉信息学院助理教授赵行在展会现场对《智能涌现》说。 这时,工作人员将被子随机弄乱,一位观众下达了铺床的指令,机器人随即开始工作。 看似简单的工作,机器人却调用了全身23个自由度,往往要分三步实现:它先通过底盘移动至最佳作业位;随后升降、俯仰躯干,调整合适的工作角度; 最后用机械臂抓住被子,外拉、展平。 三个步骤间也相互影响:机器人如果一开始没走到位,就会抓不住被子;即使走到位,如果被子在床很中间的位置,躯干就得特别往前倾去"够"到;抓取 时,由于被子较重,不能仅靠臂拉动时,机器人还要通过全身位移去拉平。 这场演示的背后,是星海图新发布的 VLA(Vision-Language-Action, ...