机器人具身操作评估新范式来了,从此告别单一成功率指标
机器之心·2026-01-31 04:10

作者介绍:刘梦源,北京大学深圳研究生院研究员,研究领域为人类行为理解与机器人技能学习;盛举义,北京大学在读博士研究生,研究方向为机器人操作技 能学习方法研究;王梓懿、李培铭,北京大学在读硕士研究生,研究方向为视频理解分析;徐天铭,北京大学在读硕士研究生,研究方向为机器人操作技能学习 方法研究;徐天添,中国科学院深圳先进技术研究院集成所研究员,研究领域为磁控微型机器人导航、机器人的协同控制等;刘宏,北京大学深圳研究生院教 授,研究领域为计算机视觉与智能机器人、机器学习与智能人机交互。 随着 Vision-Action (VA) 和 Vision-Language-Action (VLA) 模型的爆发,机器人模仿学习取得了长足进步。然而,当前的评估体系却面临着严重的「 信任危机」。 现有的评估范式主要依赖二元的「 成功率(Success Rate) 」,这种简单的指标掩盖了两个关键问题: 为了解决上述评估信任危机,北大与中科院团队提出了一套完整的解决方案: Eval-Actions 评估基准与 AutoEval 自动化评估架构 。该方案旨在从「 细粒度动作 质量」和「 来源真实性」两个维度,重塑机器人操作的评估标 ...