机器人终于“学会变通”?千寻智能提出State-free Policy纯视觉运动策略,让机器人泛化能力飙升
机器人大讲堂·2025-10-08 09:49
在具身智能驱动的机器人操控领域,基于模仿学习的视觉 —运动策略( Visuomotor Policies )已成为实现 机器人自主操作的重要技术路径。这类策略通常依赖于视觉观测与本体感知状态( Proprioceptive States )的融合范式,通过融合来自摄像头等传感器的外部环境信息和机器人自身的关节角度、末端位置等内部状 态,实现对动作输出的精确控制。该范式虽已在多个任务中取得显著成效,并被广泛应用于各类机器人学习系 统中,却隐含着一个关键缺陷:策略模型对本体感知状态输入的过度依赖,容易导致其在训练轨迹上产生过拟 合,进而削弱其在未见空间配置下的泛化能力。 具体而言,当策略过度依赖如机器人基座坐标、关节角度等内部状态时,其决策过程会逐渐 "固化"于特定的 空间位置与运动轨迹。一旦测试环境中物体的位置、桌面的高度或机器人的起始位姿发生改变——即便视觉场 景在语义上高度相似——策略的表现也可能急剧下降。这种对空间变化的敏感性,严重制约了机器人在动态、 非结构化现实环境中的适用性,也使得每一项新任务的部署都需耗费大量数据与调试成本。 针对上述痛点,千寻智能的研究 团队 在论文 " Do You Need ...