InternData-A1开源:纯合成数据性能比肩顶级真实数据,效果媲美官方π0模型
具身智能之心·2025-11-28 00:04

编辑丨具身智能之心 本文只做学术分享,如有侵权,联系删文 >> 点击进入→ 具身智能之心 技术交流群 更多干货,欢迎加入国内首个具身智能全栈学习社区 : 具身智能之心知识星球 (戳我) , 这里包含所有你想要的。 在机器人视觉 - 语言 - 动作(VLA)模型领域,"数据瓶颈" 始终是核心障碍——真实机器人数据采集成本高、规模受限,而现有合成数据覆盖场景单一、泛化能力 弱。 由上海人工智能实验室、北京大学等团队联合推出的 InternData-A1 ,以 "高保真合成数据 + 模块化生成 pipeline" 的创新方案,首次实现纯合成数据预训练 VLA 模 型性能比肩顶级真实数据集,既突破了数据规模与多样性限制,又通过低成本生成、精准模拟 - 现实迁移,为机器人通用化学习提供了全新路径。 开源链接: https://huggingface.co/datasets/InternRobotics/InternData-A1 点击下方 卡片 ,关注" 具身智能 之心 "公众号 作者丨 Yang Tian等 为什么需要重构机器人预训练数据范式? 当前 VLA 模型训练陷入 "两难困境":真实数据虽保真度高,但依赖专业 ...