Workflow
大小脑协同
icon
Search documents
新国立×上交发布RoboCerebra:长时序机器人操作推理的全新评测基准
自动驾驶之心· 2025-06-29 11:33
点击下方 卡片 ,关注" 具身智能 之心 "公众号 作者丨 SonghaoHan等 编辑丨具身智能之心 本文只做学术分享,如有侵权,联系删文 >> 点击进入→ 具身智能之心 技术交流群 更多干货,欢迎加入国内首个具身智能全栈学习社区 : 具身智能之心知识星球 (戳我) , 这里包含所有你想要 的。 Ideal Dynamic Memory Execution Memory Exploration Mix 1 问题背景与动机 近年来,视觉-语言模型(VLM)凭借对图像与文本的强大对齐能力,为机器人带来了"看图执行指令"的全 新范式。研究者只需给出一句自然语言命令,机械臂便能在仿真或真实桌面环境中完成抓取、移动、放置 等操作。这类系统通常以 VLA 等 "小脑" 模型的形式存在:直接把多模态观测映射到低层控制信号,强调 即时反应与传感-运动耦合。然而,随着任务场景从单步抓取扩展到家庭级复合操作,仅靠小脑反应已难以 胜任;机器人还需要 "大脑" VLM 进行长期规划、记忆管理与自我反思,并与小脑 Controller 高效协同。 现有公开基准的平均任务长度不足 500 步,也很少显式考察大小脑协作(Planner ...
北航×新国立×上交发布RoboCerebra:长时序机器人操作推理的全新评测基准
具身智能之心· 2025-06-28 07:48
点击下方 卡片 ,关注" 具身智能 之心 "公众号 作者丨 SonghaoHan等 编辑丨具身智能之心 本文只做学术分享,如有侵权,联系删文 >> 点击进入→ 具身智能之心 技术交流群 更多干货,欢迎加入国内首个具身智能全栈学习社区 : 具身智能之心知识星球 (戳我) , 这里包含所有你想要 的。 Ideal Dynamic Memory Execution Memory Exploration Mix 1 问题背景与动机 近年来,视觉-语言模型(VLM)凭借对图像与文本的强大对齐能力,为机器人带来了"看图执行指令"的全 新范式。研究者只需给出一句自然语言命令,机械臂便能在仿真或真实桌面环境中完成抓取、移动、放置 等操作。这类系统通常以 VLA 等 "小脑" 模型的形式存在:直接把多模态观测映射到低层控制信号,强调 即时反应与传感-运动耦合。然而,随着任务场景从单步抓取扩展到家庭级复合操作,仅靠小脑反应已难以 胜任;机器人还需要 "大脑" VLM 进行长期规划、记忆管理与自我反思,并与小脑 Controller 高效协同。 现有公开基准的平均任务长度不足 500 步,也很少显式考察大小脑协作(Planner ...
人形机器人系列(九):从Components到Functions,看手眼协作、大小脑协同的投资机会
Changjiang Securities· 2025-05-06 14:58
人形机器人系列(九): 从Components到Functions,看手 眼协作、大小脑协同的投资机会 长江证券研究所机械研究小组 2025-05-06 %% %% %% %% research.95579.com 1 证券研究报告 • 证券研究报告 • 评级 看好 维持 分析师 赵智勇 分析师 倪蕤 分析师 刘晓舟 SAC执业证书编号:S0490517110001 SAC执业证书编号:S0490520030003 SAC执业证书编号:S0490524030001 SFC执业证书编号:BRP550 分析师及联系人 %% %% research.95579.com 2 01 人形机器人产业快速推进,仍存 在应用痛点 02 Functions仍有瓶颈约束,视觉+ 运控+手眼协同为重要细分架构 目 录 %% research.95579.com 3 01 人形机器人产业快速推进,仍存在应用痛点 %% %% %% %% %% %% research.95579.com 4 人形机器人首先是要造好一个人形机器人本体 01 ➢ 2022年10月特斯拉提出人形机器人OPtimus硬件设计方案,遵循第一性原理,包括14个旋转 ...