具身大模型LaST₀:双臂/移动/灵巧手全面新SOTA,首次引入隐空间时空思维链
量子位·2026-02-07 07:02
La ST₀ 团队 投稿 量子位 | 公众号 QbitAI 近日, 至简动力、北京大学、香港中文大学、北京人形机器人创新中心 提出了一种名为LaST₀的全新隐空间推理VLA模型,在基于 Transformer混合专家架构的快慢系统中,实现了 隐空间时空思维链 (Latent Spatio-Temporal CoT) 过程,实现了对物理世界的高效 推理,并且保持了高频的动作预测能力。 LaST₀提供了一种在具身大模型中引入高效隐空间推理的全新范式,在双臂、移动操纵、人形灵巧手上均实现SOTA水平,超越Pi0.5。 论文链接: https://arxiv.org/abs/2601.05248 项目主页: https://vla-last0.github.io/ 视觉-语言-动作 (VLA) 模型近期展现出了强大的泛化潜力,部分前沿方法尝试在执行前显式生成语言推理链或预测未来状态。然而,这 种显式推理往往会引入不可忽视的推理延迟,从而限 制了机器人操控所需的控制频率;更重要的是,此类推理受限于语言空间,难以精准 刻画那些"不可言说"的物理属性(物理规律、环境动态、几何关系等),形成了表示瓶颈。 为了解决这些挑战,团 ...