Workflow
预训练范式
icon
Search documents
英伟达Jim Fan:「世界建模」是新一代预训练范式
量子位· 2026-02-05 04:10
henry 发自 凹非寺 量子位 | 公众号 QbitAI 继"下一个词预测"之后,世界建模 将成为新的预训练范式。 这是英伟达机器人主管 Jim Fan 给出的最新判断。 他认为,2026年将成为大世界模型(Large World Models)真正为机器人领域以及更广义的多模态AI奠定基础的第一年。 谢赛宁随即转发表示赞同:"事后看来显而易见"。 在这篇长文中,Jim Fan讨论了世界模型的定义与应用,尤其聚焦于物理AI领域的发展,同时展望了新的推理形式: 世界建模(world modeling)是在给定一个动作的条件下,预测下一个合理的世界状态(或一段更长时间范围内的状态)。 以下为分享全文: 本质上,视频世界模型就是可学习的物理模拟器和渲染引擎。 它们能够捕捉反事实情景(counterfactuals),即预测如果采取不同动作,未来可能会如何不同——这就是推理。世界模型从根本上以视觉 为中心。 第二个预训练范式 下一个词预测(Next word prediction )曾是第一个预训练范式,而现在我们正在经历第二次范式转变: 世界建模(world modeling) ,或者说 "下一个物理状态预测" ...