微软研究院发布Rho-alpha机器人模型,融合了视觉、语言和触觉功能
Sou Hu Cai Jing·2026-02-06 21:19

智行时代——具身智能技术生态 参与该项目的研究人员表示,缺乏多样化的真实世界机器人数据仍然是基础模型面临的主要挑战。 华盛顿大学助理教授阿比舍克·古普塔(Abhishek Gupta)表示:"虽然通过远程操作机器人系统生成训练数据已成为一种标准做法,但在许多情况下,远程操 作是不切实际的或不可能的。我们正在与微软研究院合作,利用仿真和强化学习相结合的方法,通过各种合成演示来丰富从物理机器人收集的预训练数据 集。" 据Robotics & Automation News报道,微软研究院发布了Rho-alpha,这是一款新型机器人模型,旨在帮助机器人理解自然语言指令,并在结构化程度较低 的环境中执行复杂的物理任务。 该模型源自微软的Phi系列视觉语言模型,目前正通过微软的早期研究访问计划(REAP)发布。据微软称,Rho-alpha旨在推动新一代机器人系统的发 展,使其能够在动态的真实世界环境中进行感知、推理和行动。 几十年来,机器人最擅长在工厂和仓库等严格控制的环境中运行,因为这些环境中的任务是可预测的,并且经过精心编写。然而,近年来智能体人工智能 的进步正在催生新的"视觉-语言-动作"模型,使物理系统能够以更 ...