Workflow
视觉 - 语言 - 动作VLA模型
icon
Search documents
全部超越π0、π0.5!端到端全身VLA模型Lumo-1
自动驾驶之心· 2025-12-12 03:02
点击下方 卡片 ,关注" 具身智能 之心 "公众号 编辑丨具身智能之心 本文只做学术分享,如有侵权,联系删文 >> 点击进入→ 具身智能之心 技术交流群 更多干货,欢迎加入国内首个具身智能全栈学习社区 : 具身智能之心知识星球 (戳我) , 这里包含所有你想要的。 让机器人「热面包」 尽管没见过这块面包,机器人通过推理识别它,推理出加热=用微波炉,以及开门、拿起、放入、关门、旋钮、等待、取出……无需编程,全程推理完成! AI机器人公司星尘智能提出 端到端全身VLA模型——Lumo-1,旨在让机器人心手合一,想清楚就干活 ,借助具身化VLM、跨本体联合训练、推理-动作真机训 练、以及强化学习校准对齐等方式,配合绳驱机器人S1的高质量真机训练,将大模型"心智"转化为全身到手的丝滑操作。 「整理文具」 在混乱桌面中快速找齐文具,还能精细处理不同形状、材质和尺寸的物品⚡️ 「把可乐放进蓝盘」 甚至推理出先用左臂,但遇障时换右手拿更快 从走路、跳舞到后空翻,动作模仿教会了机器人「怎么动」,而到端盘子、分拣水果、热食物等复杂操作时,机器人不能只模仿,更要识别复杂环境,理解「为什 么做」的任务意图,再转化为「动手这么做」的 ...
端到端全身VLA模型Lumo-1:让机器人心手合一,迈进推理-行动闭环时代
具身智能之心· 2025-12-10 10:00
点击下方 卡片 ,关注" 具身智能 之心 "公众号 编辑丨 具身智能之心 本文只做学术分享,如有侵权,联系删文 >> 点击进入→ 具身智能之心 技术交流群 更多干货,欢迎加入国内首个具身智能全栈学习社区 : 具身智能之心知识星球 (戳我) , 这里包含所有你想要的。 机器人「热面包」 尽管没见过这块面包,机器人通过推理识别它,推理出加热=用微波炉,以及开门、拿起、放入、关门、旋钮、等待、取出……无需编程,全程推理完成! 「整理文具」 在混乱桌面中快速找齐文具,还能精细处理不同形状、材质和尺寸的物品⚡️ 「把可乐放进蓝盘」 Lumo-1展现了强大的操作智能与泛化能力, 在多步骤长时序、精细灵巧操作、可泛化抓取放置等三大类核心操作任务中,全部超越了π0、π0.5等先进模型 ,尤其 在未见过的物体、场景和指令等分布外情况(Out of Distribution,简称OOD),以及抽象、模糊、需扩展推理的指令中,优势更为明显。 从"背菜谱"到"懂烹饪" 人类执行复杂任务时不只是调用"动作库",而是实时进行多层次推理——理解抽象语义、拆解子任务、感知空间关系、规划运动路径。让机器人像人一样推理,就 更能像人一样行动。 ...