从 LLM 到 World Model:为什么我们需要能理解并操作世界的空间智能?
海外独角兽·2025-12-03 12:05

编译:Haozhen、Gemini 如今 LLM 的语言理解与生成能力已展现出惊人的广泛适用性,但随着 LLM 的发展,一个事实越 发凸显:仅靠语言,仍不足以支撑真正的智能。 从更本质的角度看,人类处理世界的方式从来不只依赖文字,而是通过视觉、空间感知、物理直觉 与行动能力等共同构成完整的认知体系。语言只是对三维世界的"有损压缩":它记录结论,却省略 过程;它表达结构,却隐藏动态。而真正的智能,源于不断与世界互动、不断在空间中推理和行动 的能力。 正因如此,构建能够"理解并操作世界"的空间智能(Spatial Intelligence)与世界模型(World Models)成为继 LLM 之后的关键方向。 2024 年,李飞飞、Justin Johnson 等学者创立了 World Labs,今年 11 月推出了 Marble 这个 3D 世界 生成模型。团队尝试突破模型"只懂文本"的限制,让模型具备在三维环境中定位、推理、模拟、生 成甚至执行任务的能力。这不仅意味着新的技术路线,也意味着新的 AI 价值尺度:从语言走向世 界、从描述走向交互、从静态认知走向动态智能。 本文整理了李飞飞和 Justin Joh ...