Physical Intelligence最新π0.5+ego!从人类视频到机器人技能的跨模态迁移
具身智能之心·2025-12-31 04:00
点击下方 卡片 ,关注" 具身智能 之心 "公众号 作者丨 Simar Kareer等 编辑丨具身智能之心 本文只做学术分享,如有侵权,联系删文 >> 点击进入→ 具身智能之心 技术交流群 更多干货,欢迎加入国内首个具身智能全栈学习社区 : 具身智能之心知识星球 (戳我) , 这里包含所有你想要的。 在机器人学与多模态智能领域,人类经验是赋予机器人物理智能的核心源泉,但如何让机器人直接从海量人类视频中学习技能,一直面临着模态差异、数据对齐等 关键挑战。 来自 Physical Intelligence 与佐治亚理工学院的联合团队 提出的 " +ego" 框架,以 "规模化预训练 + 跨模态协同微调" 为核心,首次揭示了视觉 - 语 言 - 动作(VLA)模型中 "人类 - 机器人技能迁移" 的涌现性规律,为通用机器人政策的规模化训练提供了全新思路。 ★ 论文题目:Emergence of Human to Robot Transfer in Vision-Language-Action Models 核心亮点:无显式对齐的跨模态迁移、多样化预训练驱动的涌现能力、仅需数十小时人类数据实现性能翻倍、覆盖场景 / ...