清华研究生开源大一统世界模型:性能超越硅谷标杆40%!
量子位·2026-02-06 10:10
金磊 发自 凹非寺 量子位 | 公众号 QbitAI 这就是由 生数科技 联合 清华大学 ,正式开源的大一统世界模型—— Motus 。 项目主要负责人,是来自清华大学计算机系朱军教授TSAIL实验室的二年级硕士生 毕弘喆 和三年级博士生 谭恒楷 。 之所以说是大一统,是因为Motus在架构上,直接把VLA(视觉-语言-动作)、世界模型、视频生成、逆动力学、视频-动作联合预测这五种具 身智能范式, 首次 实现了"看-想-动"的完美闭环。 而且在50项通用任务的测试中,Motus的绝对成功率比国际顶尖的 Pi-0.5 提升了 35% 以上,最高提升幅度甚至达到了 40%! 在Motus的加持之下,现在的机器人已经具备了 预测未来 的能力。 国产开源 具身世界模型 ,直接秒了Pi-0.5,而且还是几位 清华硕、博士研究生 领衔推出的。 瞧, Cloudflare人机验证 任务,机器人可以轻松拿捏: 从视频中不难看出,面对形状不规则的曲面鼠标,Motus控制的机械臂不仅能精准识别,还能根据鼠标与屏幕点击框的距离,平稳连续地移 动,最后极度精准地完成点击。 再如长程多步推理的 孔明棋 任务,Motus同样展现出了严密 ...