刷屏的机器人,还困在「数据流水线」里
后空翻、跳舞、拳击、一脚踢碎西瓜……过去一年,这些充满视觉冲击力的机器人动作片段不断刷屏。行业为之振奋,资本加速涌入,公众的期待值也升 至高点:成熟的机器人产品,似乎已从实验室快步走向现实。 而在被称为机器人"学校"的数据训练中心里,场面却安静得多:数据采集员手持操作设备,引导身边的机器人完成一些看似简单的任务,比如抓起桌上的 零件,放入工具箱,再合上盖子,动作缓慢,偶尔停顿。 这只是"学习"的第一步。机器人每完成一组动作,就会生成一条结构化的数据。将这些数据投喂给大模型进行训练,且数据量要足够大,才有可能让机器 人拥有"大脑",从而脱离被动的编程控制,迈向主动的理解与决策。用业内人士的话来说,这将是"猴子和人的区别"。 这套"数据+算力+算法"的逻辑我们并不陌生,以ChatGPT、deepseek为代表,席卷全球的大语言模型已经验证了其可行性,并建设了相对成熟的算力资源 和算法体系。但机器人面对的挑战在于,这次的智能从数字世界来到了物理世界,数据成为了最高的壁垒。 大语言模型所使用的语言、图像等数据,本质上存在于二维数字世界,易获取、可复制;而机器人面对的三维物理世界,是一个高维、连续、多模态的时 空流,包 ...