英伟达世界模型再进化,一个模型驱动所有机器人!机器人的GPT时刻真正到来
驱动具身智能进入通用领域最大的问题在哪里? 我们认为,核心问题在于 「跨具 身(cross-em bodiment)迁移」 。 当然,具身智能执行通用复杂任务的核心是一个完善的世界模型。但是,大多世界模型其实并没有我们想象的那样具备极强的泛化性和迁移能力。 简单来说,这些用在机器人或是智能汽车上的世界模型,基本都是在某个固定的硬件平台上设计训练的,大多不具备很强的泛化能力,跨具身迁移几乎靠运气。 说白了,大多数机器人今天学到的不是 「世界是如何运作的」,而是 「在这台机器该怎么动」。我们需要能学到一个真正理解物理与因果的世界模型 —— 知道 世界会怎么变、动作会带来什么后果,才能在不同身体、不同环境中迁移与泛化。 在这个问题上,作为算力的王者,深耕各类世界模型的英伟达再一次发力,构建了一个全新是世界模型,一切都是 Zero-Shot 的。 最近, 英伟达 GEAR 实验室提出 DreamZero , 一种 基于预训练视频扩散骨干网络构建 的世界动作模型(WAM) 。 这是一个拥有 140 亿参数的模型,能够让机器人仅通过简单的文本提示就完成此前从未见过的任务。 实验室负责人 Jim Fan 将其称为机器人领域 ...