微软Rho-alpha模型能否把机器人真正带入物理智能的世界?
Sou Hu Cai Jing·2026-01-29 16:14

1月21日,微软研究院推出首款机器人专属 Rho-alpha 模型,该模型基于 Phi 系列视觉语言模型打造,可 直接将自然语言指令转化为控制信号,实现多模态感知与端到端控制,当然这不是重点,重点是Rho- alpha 模型除了视觉与语言两大基础感知维度之外,创新性地加入了触觉感知模块,将机器人直接拉入 物理智能的范畴。 要知道过去的几十年间,人形机器人的研发重点一直围绕结构设计、新型材料、高性能电机和精密控制 系统展开。而微软的全新Rho-alpha模型,直接连接了机器人的感知、语言与动作,成为了决定机器人 能力上限的关键。 这款模型的研发目标十分明确,就是打破机器人只能在高度可控环境内运行的限制,推动机器人走进复 杂且充满不确定性的真实世界开展工作。这意味着机器人可以摆脱固定脚本的约束,依靠模型自主生成 适配不同场景的动作。 微软将这种技术路径命名为"Physical AI",简单来说,就是让人工智能从数字世界延伸到物理世界,实 现与真实环境的直接交互。传统大模型的优势集中在语言交互层面,而Rho-alpha的发力点在于解决机 器人"动手执行"的实际问题。 ▍对比其他模型微软Rho-alpha模型有三个非 ...