Workflow
无需再训练即可增强性能!港大团队提出GPC框架,实现机器人「策略组合」
机器之心·2025-10-19 09:17

本文一作曹嘉航,香港大学在读博士生,前北京人形机器人创新中心实习生;共同一作黄翊泽,上海交通大学在读本科生;通讯导师 Andrew F. Luo,香港大学助 理教授。 在机器人学习领域,提升基于生成式模型的控制策略(Policy)的性能通常意味着投入巨额成本进行额外的数据采集和模型训练,这极大地限制了机器人能力的快 速迭代与升级。面对模型性能的瓶颈,如何在不增加训练负担的情况下,进一步挖掘并增强现有策略的潜力? 香港大学团队开创性地提出了 GPC(General Policy Composition,通用策略组合) 框架,为这一挑战提供了全新的免训练解决方案。该框架通过在测试时(test- time)对多个预训练模型进行 "策略组合",能够创造出一个性能超越任何单一父策略的 "组合策略"。 GPC 作为一个 "即插即用" 的通用框架,能够灵活融合不同架构(如 Diffusion-based Policy、Flow-based Policy)、不同模态(如视觉-动作模型 VA、视觉-语言-动 作模型 VLA)的机器人策略,打破了传统性能提升方式对数据和算力的依赖。 论文标题: Compose Your Poli ...