Workflow
多模态世界模型体系
icon
Search documents
具身世界模型开源 让机器人学会“预演”未来
Yang Shi Wang· 2025-10-25 14:59
当前,机器人的运动能力正在迅速进化,有些已经可以很轻松地完成后空翻、跑步等动作。但是,相比完成一个后空翻,让它"理解"面前的水杯为什么倒满 水后会洒出来,就更难了。 日前,我国科研团队开源出一个名叫WoW(读作"哇哦")的具身世界模型,它让机器人可以像人类一样,进化出更好的想象力与执行力。怎么理解具身世 界模型?它如何让机器人更聪明? 总台记者 袁嘉忆:在北京人形机器人创新中心,各种形态的机器人本体正在进行具身智能数据采集和动作模型训练。这台"天工"机器人正在自主地1∶1复刻 视频中的动作姿态,而这个视频就是机器人在行动之前"想象出来"的预演画面,可以用来指导它与真实世界的交互。这样从想象预演到动作执行的"知行合 一"的能力,依托的就是由科研团队自主研发的具身世界模型。 WoW具身世界模型项目负责人 池晓威:机器人在推倒这个杯子的时候,我们人类会本能地预测到这个杯子要飞出去、要倒掉,所以我会去进行这个接杯子 的动作。世界模型本质上就是AI模拟人类思考和决策的时候,去进行想象和预测的这样一个模型,它需要去生成符合物理规律的未来预测视频,帮助机器 人真的去把想象当中的运动轨迹变到真实世界当中执行出来,从而把想象跟 ...