北京人形机器人创新中心提出具身世界模型WoW
本报讯 (记者贾丽)继DeepSeek在大语言模型开源促进行业发展后,北京人形机器人创新中心(以下 简称"北京人形")再次打破边界并开源了全新的世界模型架构,提出了一个让机器人真正"看见、理解 并行动于世界"的具身世界模型——WoW(World-Omniscient World Model),旨在帮助具身智能机器人 快速学习掌握各项技能,助力行业打造"最好用"的机器人。一经发布,该模型便受到学术界和产业界的 广泛关注。 同时,WoW不是在记忆训练场景,而是在学习"物理规律的抽象本质",具备跨机器人形态泛化、任务 泛化、场景泛化全方位能力,这类"视觉+物理"的泛化能力,是通向具身智能的关键指标。 WoW具身世界模型遵循SOPHIA范式,让模型越看越准,越生成越真实。SOPHIA自反范式是指,业内 首次提出SOPHIA框架,让世界模型"自己教自己"。 据了解,WoW具身世界模型可以实现视频生成和机器人动作闭环,意味着AI不再停留在"想象中",而 能真正"动手"去验证自己的理解,标志着真正实现从生成到执行的跨越。 北京人形提出了专测"物理一致性与因果推理"的新基准WoWBench,也是全球首个针对具身世界模型的 综 ...