机器人行业字节跳动发布通用机器人模型GR-3点评:字节推出GR-3模型 泛化性显著提升
7 月22 日,字节跳动Seed 团队发布通用机器人模型GR-3,该模型为VLA 架构,具备泛化到新物体和新 环境的能力,能理解包含抽象概念的语言指令,还能够精细地操作柔性物体。GR-3 模型与GR-2模型 (2024.10 推出)相比,在面对新环境和新物体时操作性能卓越,复杂指令理解精准度高,具备处理泛 化任务的能力,主要源于:1)模型架构上:GR-3 采用MoT+DiT 的网络结构,将"视觉-语言模 块"和"动作生成模块"集成为40 亿参数的端到端模型,生成动作后通过RMSNorm 增强动态指令跟随能 力,使机器人反应更敏捷、高效;2)训练数据上:GR-3 采用三合一数据训练法,遥操作数据(高质 量)、人类VR 轨迹数据(低成本,可达450 条数据/小时),公开图文数据(理解抽象概念、认识新物 体以提升泛化能力)。 硬件跟随软件协同创新,同步推出通用双臂移动机器人ByteMini。 字节推出GR-3 模型,复杂长任务执行能力较好,泛化性显著提升,建议关注产业链相关标的。 投资要点: 投资建议:从 字节跳动公开进展看,其具身智能持续迭代发展,暂无明确商业化规划。随着技术进步 和产业链成熟,我们认为字节具备进 ...