ManiAgent
Search documents
原力灵机提出ManiAgent!会 “动手”,会 “思考”,还会“采数据”!
具身智能之心· 2025-10-20 10:00
点击下方 卡片 ,关注" 具身智能 之心 "公众号 在机器人操作领域,Vision-Language-Action(VLA)模型虽已展现出一定技术潜力,但其在 复杂推理 与 长程任务规划 场景下的性能,仍受限于数据稀缺与模型 容量两大核心问题。为此,我们提出了 ManiAgent —— 一种面向通用机器人操作任务的智能体架构,该架构可实现从 任务描述、环境输入 到 机器人操作动作 的 端到端输出 。 在 ManiAgent 框架中,多个智能体通过协同交互分别承担环境感知、子任务分解与动作生成功能,能够高效应对复杂操作场景。我们通过实验评估发现, ManiAgent 在 SimplerEnv 基准测试中的任务成功率达 86.8%, 在 真实世界拾取 - 放置任务 中的成功率更高达 95.8%。 值得注意的是,依托其高任务成功率, ManiAgent 还可作为 高效数据采集工具 ,基于该工具获取的训练数据所构建的 VLA 模型,性能能够与基于人工标注数据集训练的 VLA 模型相媲美,这为机器 人操作领域的技术优化与落地提供了重要支撑。 图1: ManiAgent的整体工作流程示例 论文题目:ManiAgent: ...