Workflow
合成仿真数据
icon
Search documents
面对具身智能数据瓶颈问题!孙富春、赵明国、王鹤、庞江淼、赵同阳、仉尚航、卢宗青、高阳、唐剑都有怎样的思考?
机器人大讲堂· 2025-06-30 07:22
数据被视为具身智能(Embodied Intelligence)落地的"最后一公里",其核心在于,数据直接决定了智能体能 否从虚拟训练环境无缝迁移至复杂多变的物理世界,并实现稳定可靠的交互与决策。 与大语言模型数据不同,具身智能需要采集物理交互中的高维动态数据(如力反馈、材质摩擦、碰撞响应 等),但真实场景数据获取依赖精密传感器和硬件设备,且受限于场景多样性、安全风险及隐私等问题,目前 全国范围内具身智能最大开源数据集规模也只有百万级别,相比自动驾驶领域的单日上亿条数据,相差百倍以 上。 除数据规模外,在涉及具体智能体物理交互的相关问题(例如"抓取力度""滑动摩擦系数")时,这些数据难以 用语言进行精准描述。数据标注工作需结合动作意图与环境反馈,正因如此,大量数据的标注任务仍需依赖人 工完成。 针对具身智能数据问题,近日2025北京智源大会 上 孙富春、赵明国、王鹤、庞江淼、赵同阳、仉尚航、卢宗 青、高阳、唐剑 等行 业领军人物 ,分享了他们在具身智能数据方面的思考。 ▍ 孙富春:未来团队将采集200万条轨迹、数据总量52 TB 远超英伟达数据规模 清华大学计算机科学与技术系教授、中国人工智能学会副理事长孙富 ...