Workflow
边缘设备上高效运行!NanoVLA :保留 VLA 模型的精度与泛化能力,推理速度提升 52 倍
具身智能之心·2025-11-01 16:03

点击下方 卡片 ,关注" 具身智能 之心 "公众号 作者丨 Jiahong Chen等 编辑丨具身智能之心 本文只做学术分享,如有侵权,联系删文 >> 点击进入→ 具身智能之心 技术交流群 更多干货,欢迎加入国内首个具身智能全栈学习社区 : 具身智能之心知识星球 (戳我) , 这里包含所有你想要的。 在机器人操控领域," 通用化 " 与 " 轻量化 " 的矛盾长期制约着技术落地——现有视觉-语言-动作(VLA)模型虽能实现复杂任务推理,但因参数量庞大、计算需求 高,难以部署在移动机器人、嵌入式系统(如 Jetson Orin Nano)等资源受限设备上。 而由英属哥伦比亚大学、阿尔伯塔大学与小米汽车团队联合提出的 NanoVLA ,用 " 视觉-语言解耦融合+长短动作分块+动态路由 " 的创新架构,彻底打破这一困 境:既保留通用 VLA 模型的任务精度与泛化能力,又将推理速度提升 52 倍、参数量压缩 98%,首次实现 "在边缘设备上高效运行通用机器人策略" 的目标。 为什么要重构 VLA 模型的边缘部署逻辑? 当前主流 VLA 模型陷入 "性能与效率不可兼得" 的困境:为实现跨任务泛化,模型通常依赖数十亿参 ...