全部超越了π0、π0.5!端到端全身VLA模型Lumo-1:迈进推理-行动闭环时代
具身智能之心·2025-12-11 02:01

点击下方 卡片 ,关注" 具身智能 之心 "公众号 编辑丨具身智能之心 本文只做学术分享,如有侵权,联系删文 >> 点击进入→ 具身智能之心 技术交流群 更多干货,欢迎加入国内首个具身智能全栈学习社区 : 具身智能之心知识星球 (戳我) , 这里包含所有你想要的。 让机器人「热面包」 在混乱桌面中快速找齐文具,还能精细处理不同形状、材质和尺寸的物品⚡️ 「把可乐放进蓝盘」 甚至推理出先用左臂,但遇障时换右手拿更快 从走路、跳舞到后空翻,动作模仿教会了机器人「怎么动」,而到端盘子、分拣水果、热食物等复杂操作时,机器人不能只模仿,更要识别复杂环境,理解「为什 么做」的任务意图,再转化为「动手这么做」的连贯操作。 人类的行动,一般都依托于上下文和意图,核心就在于推理。对机器人而言,尽管大规模互联网数据让GPT、DeepSeek等AI具备了不错的推理能力,但让AI在真实 物理世界里通过推理"准确动起来",特别是处理多步骤长时序任务、模糊指令、未见过情景时,依然挑战重重。 尽管没见过这块面包,机器人通过推理识别它,推理出加热=用微波炉,以及开门、拿起、放入、关门、旋钮、等待、取出……无需编程,全程推理完成! 「整理文具 ...