RoboMirror
Search documents
智源&港科大等出品!RoboMirror:让机器人先 “读懂” 视频,再精准复刻每一个动作
具身智能之心· 2026-01-09 00:55
点击下方 卡片 ,关注" 具身智能 之心 "公众号 作者丨 Zhe Li等 编辑丨具身智能之心 本文只做学术分享,如有侵权,联系删文 >> 点击进入→ 具身智能之心 技术交流群 更多干货,欢迎加入国内首个具身智能全栈学习社区 : 具身智能之心知识星球 (戳我) , 这里包含所有你想要的。 ★ 本文的主要作者来自北京智源人工智能研究院、香港科技大学、哈尔滨工业大学、上海交通大学、北京大学和悉尼大学。本文的第一作者为北京智源人工智能 研究院的实习生李哲,主要研究方向为具身智能和3D数字人。共同一作是香港科技大学的硕士生朱泊安。本文的通讯作者为北京大学计算机学院研究员、助理 教授仉尚航和北京智源研究院研究员迟程。 ★ 行业痛点:音频与关节驱动的弱耦合 想象这样两个场景:你戴着 GoPro 记录下自己拖地、运球的第一视角视频,远在另一端的人形机器人就能同步复刻动作,仿佛你亲自在场操作;打开一段第三人称 视频,机器人无需等待复杂的姿态解析,直接理解视频中奔跑、交替出拳的意图,流畅完成模仿。 这不是未来科幻,而是 RoboMirror 正在实现的 "先理解、后模 仿" 的具身智能新范式。 长久以来,机器人模仿人类动作始终 ...