Workflow
字节团队最新Robix!全能大模型,一个模型就能搞定机器人推理、任务规划和交互
具身智能之心·2025-09-08 00:03

项目链接:https://robix-seed.github.io/robix/ 点击下方 卡片 ,关注" 具身智能 之心 "公众号 作者丨 Huang Fang等 编辑丨具身智能之心 本文只做学术分享,如有侵权,联系删文 >> 点击进入→ 具身智能之心 技术交流群 更多干货,欢迎加入国内首个具身智能全栈学习社区 : 具身智能之心知识星球 (戳我) , 这里包含所有你想要的。 当机器人在餐桌前接到"打包高热量食物并拿一杯饮品"的指令,却在拿起可乐时突然得知用户对咖啡因过敏 —— 它能否及时停下动作,换一杯无咖啡因饮品? 当整理桌面时遇到"扔掉所有垃圾"的模糊要求,它能否主动确认"未明确的鸡腿是否需要丢弃"?这些真实场景中的灵活应对,正是当前通用机器人迈向"人性化 助手"的关键瓶颈。 在开放动态的日常环境中,机器人不仅需要精准执行操作,更需具备 "看懂" 物理世界(如判断物体空间位置、动作可行性)和 "听懂" 人类需求(如处理临时中 断、澄清模糊指令)的双重能力。但现有分层机器人系统的高层认知模块往往难以兼顾:要么依赖视觉 - 语言模型仅完成任务分解,缺乏将数字概念落地到物理 操作的 具身推理能力 ;要么采用手 ...