IROS2025论文分享:基于大语言模型与行为树的人机交互学习实现自适应机器人操作
机器人大讲堂·2025-12-23 07:04
近年来,大型语言模型 ( Large Language Model, LLM )展现出了强大的自然语言处理能力。许多研究已 将 LLM 应用于机器人,以实现指令执行任务,例如 SayCan 、 RT-2 、 VoxPoser 等。然而,这些方法需 要反复调用 LLM 来处理外部干扰,这是一个非常耗时的过程。 机器人领域的一个活跃研究方向是将 LLM 与行为树( Behavior Tree, BT )相结合。 LLM 被用于将用户指 令解释为包含任务目标条件的行为树。当外部干扰导致 BT 中的条件无法达成时,行为树规划器( BT Planner )会基于动作数据库( Action Database ),迭代地将未达成的条件扩展为子树,旨在通过执行动 作来达成这些条件。 尽管这些方法能够以较少的 LLM 调用次数处理外部干扰,但动作数据库是人工预先构建的。当应用于超出 BT Planner 能力范围的新任务时,则需要具备增量学习能力。强化学习需要大量的训练和精心设计的奖励函 数;模仿学习需要大量的专家示范数据;无监督学习可能导致结果偏离预期。一种新颖的方法是使用 LLM 来 学习机器人操作。然而,使用 LLM 生 ...