Workflow
GigaTrain
icon
Search documents
世界模型和具身大脑最新突破:90%生成数据,VLA性能暴涨300%|开源
量子位· 2025-12-02 04:59
允中 发自 凹非寺 量子位 | 公众号 QbitAI VLA模型性能暴涨300%,背后训练数据还 首次实现90%由世界模型生成 。 具身智能迈向开放世界落地的 最大瓶颈 , 长期以来并非算法本身,而是高质量、大规模真实机器人交互数据的极度稀缺 。 真机数据采集成本高昂、周期漫长,且难以覆盖多样化的开放场景,严重限制了VLA大模型的规模化训练与泛化能力。而传统仿真虽能快速生 成数据,却受限于显著的Sim-to-Real gap,难以支撑真实世界的鲁棒部署。 世界模型(World Model)被认为是破解这一困境的关键 :通过学习真实世界的规律,世界模型可以生成高保真、可控、多样化的具身交互 数据,突破真机数据不足的限制。 在此背景下,刚刚获得华为投资的国产世界模型公司 极佳视界 发布并开源具身世界模型 GigaWorld-0,成功将世界模型生成数据在VLA训 练中的占比提升至90% 。 所训练的VLA模型在新纹理(训练中未见材质表面)、新视角(训练中未见的观测角度)、新物体位置(训练中未见的空间布局) 三大泛化 维度上均实现近300%的性能提升 , 标志着具身智能正式迈入"数据高效、高泛化、低成本"的新阶段 。 ...