百万规模数据集打造人形机器人通用大模型,实现精细动作跨平台、跨形态动作迁移丨北大人大联合发布
量子位·2025-05-14 08:55
北大卢宗青团队 投稿 量子位 | 公众号 QbitAI 北大和人大团队在通用人形机器人动作生成领域取得重大突破! 首创性地提出了具备数据-模型协同放量 (Scaling Law) 特性的 通用动作生成框架Being-M0 。 通过大规模互联网视频,构建了业界 首个百万规模的动作生成数据集MotionLib 。 又基于此数据集,研发了端到端的文本驱动动作生成模型,实现了具备规模效应的复杂、多样的人类动作生成,做到了人体动作向多类型人形 机器人的动作迁移。 文章将发表于ICML2025。 创新点 百万级动作数据集MotionLib Being-M0团队构建了业界首个突破百万规模的动作生成数据集,并建立了从原始视频到高质量动作数据的全自动化处理流程,大幅提升 了数据获取效率。 在人工智能领域,数据规模的突破往往能带来模型性能质的飞跃。 为构建大规模动作数据集,Being-M0团队从公开数据集和在线平台系统性地收集了超过2000万段人体动作视频。面对海量的互联网视频数 据,如何实现高质量动作数据的自动化提取成为了关键挑战。 为此,Being-M0团队开发了一套创新的数据处理流水线: 首先,基于预训练模型进行2D人体关 ...