这么哇塞的世界模型,竟然是开源的!
量子位·2026-01-29 08:27

整整三天,一波接一波连续开源。 在机器人的 眼睛 (LingBot-Depth) 和机器人的 大脑 (LingBot-VLA) 之后,刚刚, 蚂蚁灵波 又开源了一个大的: 金磊 发自 凹非寺 量子位 | 公众号 QbitAI 通用的世界模型——LingBot-World。 是可以支持在10分钟时长里,一直生成、一直交互的那种,来感受一下这个feel: 不难看出,视觉效果已经做到了与DeepMind推出的 Genie 3 不相上下,但时间维度上明显是更长。 而且LingBot-World生成的视频不只是能看,你也可以 深度参与 其中。 你可以通过键盘(WASD)和鼠标,实时控制视角的推进、旋转,就像在玩一款3A大作一样: 当然, Agent 也能够在生成的世界中自主规划并执行动作。 与此同时,你也可以用 自然语言 的方式去 实时改变 生成世界里的一切。 例如我们"喂"给LingBot-World这样一张初始图: 就仿佛一切都在自然演进、发生一样: 并且LingBot-World还严格遵循现实世界的 物理规律 ,同样是这只猫咪,当它撞到沙发的时候就不会出现穿模的情况,会显得更加真实: 只需输入"前面放个烟花"(0 ...

这么哇塞的世界模型,竟然是开源的! - Reportify