GWM Worlds
Search documents
美国视频生成老炮儿,入局世界模型
量子位· 2025-12-13 04:34
鹭羽 发自 凹非寺 量子位 | 公众号 QbitAI 世界模型赛道,又有老面孔新鲜入局! 就在刚刚,Runway发布旗下首个通用世界模型 GWM-1 。 不止于此,还打包发布了一系列世界模型变体: 而这些通通都是基于最新版 Gen-4.5 建立的。 是的!Runway这次还把Gen-4.5来了个大升级。 模拟真实环境的GWM Worlds; 模拟人物对话的GWM Avatars; 模拟机器人操作的GWM Robotics。 …… 看来年末大促销的不只有圣诞老人奥特曼,还有好莱坞名导Runway。 话不多说,上实机: 世界模型全家桶发布 根据官方介绍,GWM-1是基于Gen-4.5构建的,这是Runway最新的视频生成模型。 但和Gen-4.5有所不同的是,GWM-1采用的是 自回归 架构,它可以根据之前的记忆内容,进行逐帧预测生成。 另外模型支持实时交互控制,包括调整相机姿态、修改机器人操作指令或音频。 它目前包含三个变体: 1、GWM Worlds:用于实时环境的模拟与探索。 GWM Worlds能够让用户在连贯、有反应的世界中自由移动,而无需手动设计每个空间。 具体来说,用户首先需要为模型提供一个可供参考 ...
2026 将近,世界模型到底更「世界」了吗?
机器之心· 2025-12-13 02:30
引言 :近期 Runway 发布 GWM Worlds 和 GWM Robotics,将视频生成进一步推向可交互的「世界模拟」范式。这一动作也让「世界模型」的讨论重新聚焦:它究竟是一套 面向创作与交互的 Interface,一台用于训练与评测的 Simulator,还是一种面向推理与决策的认知框架? 目录 01. 从 RL 分支到演化建模,世界模型这两年经历了怎样的转变? Sora 式像素级模拟更可靠,V-JEPA 式抽象表征预测更高效?... 02 . 界面、模拟器还是认知框架,世界模型的定义依旧模糊? 世界模型输出的「世界」应是静态资产、实时帧序列,还是驱动预测与控制的 latent state?... 03 . 重押还是凑数,国内外各厂商如何布局世界模型? 本文来自PRO会员通讯内容,文末关注「机器之心PRO会员」,查看更多专题解读。 从 RL 分支到演化建模,世界模型这两年经历了怎样的转变? 1、当下的世界模型已经被业内认为是和 LLM 同级别的 AGI 路线,但如果把时间拨回 2024 年初,世界模型的定义其实是相对收敛的,更多集中在强化学习的语境中。[2-1] ① 当时的分析认为,世界模型是智能体 ...
Runway深夜炸场:一口气发布5大更新,首个通用世界模型来了
机器之心· 2025-12-12 04:31
机器之心编辑部 GPT-5.2 更新 的同时,主攻 AI 视频与多媒体生成技术的独角兽 Runway 也来了一波大的:一口气来了 5 个「激动人心的宣布」。 这一波更新之猛,甚至让人觉得他们是不是把过去半年的大招一次性全放了出来。Runway 这一波发布,不仅刷新了视频生成的各项指标,更重要的是,他们正式 对外展示了其在 通用世界模型(General World Models/GWM) 上的野心。 如果说之前的竞争还在于谁生成的视频更清晰、谁的时间更长,那么 Runway 今天似乎想说:「我们不再只是生成像素,我们在模拟世界。」 此次发布的「全家桶」阵容豪华: 更有意思的是,为了庆祝这一时刻,英伟达 CEO 黄仁勋还专门给 Runway 发来了一条特别的节日祝福。 机器之心报道 话不多说,下面我们就来看看 Runway 到底要把我们带向一个怎样的未来。 Gen-4.5 作为 Runway 最新的旗舰视频模型,Gen-4.5 主打的是画面保真度和创意控制能力。 Gen-4.5 :最新的旗舰视频生成模型,不仅画质惊人,更引入了原生音频生成与编辑功能。 GWM-1 :Runway 的首个通用世界模型,这是理解物理世 ...