智源研究院院长王仲远:至少5-10年,具身智能模型才能成熟落地|钛媒体AGI
Tai Mei Ti A P P·2025-03-29 09:11
北京智源人工智能研究院院长 王仲远 3月29日消息,钛媒体AGI获悉,今天下午举行的2025中关村论坛年会"未来人工智能先锋论坛"上,智 源研究院院长王仲远发布首个跨本体具身大小脑协作框架RoboOS、开源具身大脑RoboBrain。 全新发布的两款技术产品RoboOS、RoboBrain,可实现跨场景多任务轻量化快速部署与跨本体协作,推 动单机智能迈向群体智能,为构建具身智能开源统一生态加速场景应用提供底层技术支持。 具体来说,RoboBrain由三个模块组成:用于任务规划的基座模型、用于可操作区域感知的A-LoRA模块 和用于轨迹预测的T-LoRA模块。在推理时,模型首先感知视觉输入,并将输入指令分解为一系列可执 行的子任务,然后执行可操作区域感知和轨迹预测。RoboBrain采用多阶段训练策略,使其具备长历史 帧记忆和高分辨率图像感知能力,进而提升场景感知和操作规划的能力。 目前,RoboBrain能够解读人类指令和视觉图像,以生成基于实时图像反馈的行动计划和评估,预测每 一步的轨迹并感知相应的可操作区域。在AGD20K测试集上,RoboBrain的平均精度超过了当时最先进 的开源模型Qwen2-VL, ...