DynamicVLA
Search documents
破解机器人「慢半拍」难题:南洋理工解决VLA致命短板,动态世界断层领先
机器之心· 2026-02-10 03:46
当物体在滚动、滑动、被撞飞,机器人还在执行几百毫秒前的动作预测。 对动态世界而言,这种延迟,往往意味着失败。 在过去几年中,Vision-Language-Action(VLA)模型迅速成为机器人领域的焦点:机器人可以 "看懂" 画面、"理解" 语言指令,并直接输出连续动作, 在静态抓取、摆放、桌面操作等任务中取得了显著进展。 但一个长期被忽视的问题是 —— 真实世界几乎从来不是静态的 。当物体开始移动、加速、碰撞、改变轨迹,当前主流 VLA 模型往往会出现反应迟缓、动 作失配、甚至完全失败的情况。 论文链接:https://arxiv.org/abs/2601.22153 项目链接:https://haozhexie.com/project/dynamic-vla/ GitHub 链接:https://github.com/hzxie/DynamicVLA 在静态场景中,VLA 模型通常遵循如下流程: 问题不在于模型不聪明,而在于:它们跟不上时间。 近日,来自 NTU S-Lab 的研究团队提出 DynamicVLA,首次系统性地从模型架构、推理机制和数据体系三个层面,重新审视并解决 动态物体操控 (Dyn ...