Workflow
基础模型体系
icon
Search documents
微软Rho-alpha模型能否把机器人真正带入物理智能的世界?
机器人大讲堂· 2026-01-29 14:00
1月21日,微软研究院推出首款机器人专属 Rho-alpha 模型,该模型基于 Phi 系列视觉语言模型打造,可直 接将自然语言指令转化为控制信号,实现多模态感知与端到端控制,当然这不是重点,重点是Rho-alpha 模 型除了 视觉与语言两大基础感知维度之外,创新性地加入了触觉感知模块 , 将机器人直接拉入物理智能的范 畴。 要知道过去的几十年间 ,人形机器人的研发重点一直围绕结构设计、新型材料、高性能电机和精密控制系统 展开。 而微软的全新 Rho-alpha模型,直接连接了机器人的 感知、语言与动作 , 成为了 决定机器人能力上 限的关键。 ▍ Rho-alpha 是 扎根物理世界的智能模型 按照微软官方的定义, Rho-alpha是其首款专为机器人场景打造的模型。它的核心能力,是将人类发出的自 然语言指令,直接转化为机器人的控制信号,以此完成双手协同操作类任务。 这款模型的研发目标十分明确,就是打破机器人只能在高度可控环境内运行的限制,推动机器人走进复杂且充 满不确定性的真实世界开展工作。这意味着机器人可以摆脱固定脚本的约束,依靠模型自主生成适配不同场景 的动作。 微软将这种技术路径命名为 "Phys ...