“以人为中心”的具身数采逐渐成为首选,产业玩家格局初现~
具身智能之心·2025-12-29 00:04
点击下方 卡片 ,关注" 具身智能 之心 "公众号 机器人算法这么多?为什么很难走进真实场景? 今年以来,围绕机器人操作任务,国内外团队产出了大量的工作。从physical intelligence 到国内的具身独角 兽、高校,不断在刷新各类指标,提升泛化性能。许多VLA和RL框架也逐渐完善,git上star动辄2k+,不少研 究团队持续在维护使用。 但也有一个很明显的问题,为什么VLA在真实场景中应用的很少?有些机器人在各类展会上的效果还算可 以,但稍微变动场景,就感觉"失明"一样,看着"张牙舞爪"。特别是叠衣服、拆箱子等日常生活中的一些任 务,动作固化、动作不够优雅是常态。 这个问题的根因是模型不够泛化,做过模仿学习的童鞋应该知道,模型如果"泛化性"不够,很难真的应用。 特别是具身机器人的开放场景,可能有N种动作,需要大量的数据喂给模型。 行业内一些数据采集成本高、周期长,难以规模化,定制化属性高。这就引出了一个非常重要的问题,如何 有效获取大规模高质量数据,让模型能够"泛化",能够理解任务对应的行为和操作方式。 从成本和规模上已演变出四条数据路线 目前业界已形成多种具身数据获取方案,不同方案在数据质量、 ...