字节发布全新 VLA 模型,配套机器人化身家务小能手
7 月 22 日,字节跳动 Seed 团队发布全新 VLA 模型 GR-3,支持高泛化、长程任务和柔性物体双臂操作。同时亮相的还有通用双臂移动机器人 ByteMini。 Seed 团队发布的 GR-3 和 ByteMini 都有什么亮点?其中,GR-3 具备泛化到新物体和新环境的能力,能理解包含抽象概念的语言指令,还能够精细地操作 柔性物体。通过少量的人类数据即可实现高效微调,从而快速且低成本地迁移至新任务,以及认识新物体。这与此前需要大量机器人轨迹训练的 VLA 模 型不同。 得益于改进的模型结构,GR-3 能有效处理长程任务并进行高灵巧度操作,包括双手协同操作、柔性物体操作以及融合底盘移动的全身操作等。 而这些能力是通过一种多样的模型训练方法实现的:除遥操作机器人收集的高质量真机数据外,团队还经过用户授权,征集了基于 VR 设备的人类轨迹数 据,以及公开、可用的大规模视觉语言数据进行联合训练——多样性数据的融合是 GR-3 区别于现有 VLA 模型的亮点之一。 在这两款产品中,GR-3 的定位是「机器人大脑」,而 ByteMini 就是为其设计的配套机器人。 ByteMini 作为一款具备高灵活性、高可靠 ...