Workflow
Physical Intelligence团队正式发布π*0.6
自动驾驶之心·2025-11-19 00:03

编辑丨具身智能之心 本文只做学术分享,如有侵权,联系删文 >> 点击进入→ 具身智能之心 技术交流群 更多干货,欢迎加入国内首个具身智能全栈学习社区 : 具身智能之心知识星球 (戳我) , 这里包含所有你想要的。 点击下方 卡片 ,关注" 具身智能 之心 "公众号 作者丨 Physical Intelligence团队 11月17号!Physical Intelligence团队正式发布 ,从经验中学习的VLA。 熟能生巧 人类在掌握新技能时展现出卓越的灵活性,但要达到精熟境界必然需要从反复尝试中学习。借助VLA模型等通用机器人基础模型,可以通过提示词灵活设定通用型 机器人的任务目标。但正如人类学习规律,这些模型同样需要通过反复练习才能臻于精通。 这意味着不仅要利用示范数据,更需要整合自主收集的实践数据,使策略能够修正实际部署中出现的错误,在人类远程操作水平之上提升执行速度与鲁棒性,并适 应新的部署环境。虽然基于强化学习的自主实践理论基础早在数十年前就已确立,但要将这些原理融入通用且可扩展的机器人学习系统仍面临重大挑战:为大型模 型设计可扩展且稳定的强化学习方法、处理来自不同策略的异构数据,以及在奖励信号可能 ...