NavA³
Search documents
突破机器人“语义鸿沟”:清华等提出NavA³让机器人导航成功率提升2.6倍
机器人大讲堂· 2025-10-13 04:08
在 一些 电影 片段 中,我们常常看到机器人能轻松理解 "帮我拿杯咖啡"或"把衣服晾到阳台"这样的指令, 并精准完成任务。然而,在现实世界中,让机器人具备这种高级别的理解和执行能力,一直是科研人员面临的 巨大挑战。 这背后,其实是机器人具身导航技术的现实困境。前主流的机器人导航方法,主要有两类,但都有明显的短 板。 指令跟踪导航 : 机器人需要遵循极其详细的、一步步的指令,例如 "左转,出门,直行三米"。 但这种方式 指令依赖度 过 高,要求人类提供超出自然交互习惯的细节化引导 ; 预定义物体导航 : 机器人被要求找到某个类别(如 "椅子")的任意一个实例。这忽略了具体情境,比如 在"我想喝咖啡"这个任务中,找到一台"咖啡机"远比找到任意一把"椅子"更重要。 这两种方式都存在明显的 "语义鸿沟 "。 机器人 无法理解人类高级指令背后真正的意图,也无法处理 "茶室 左边桌子上的水果"这样包含复杂空间关系的任务。现实世界的人类指令是开放、抽象且充满上下文关联的, 这使得现有的导航机器人在面对真实、复杂的家居或办公环境 的 长视域导航任务中成功率极低 。 ▍ NavA ³:给机器人装 "分层导航系统" 针对以上困境 ...