Data Pyramid

Search documents
What Is a Humanoid Foundation Model? An Introduction to GR00T N1 - Annika & Aastha
AI Engineer· 2025-07-28 16:29
Market Trends & Industry Dynamics - McKinsey 报告指出,全球 30 个最发达经济体中,职位数量超过了能够胜任的人数,过去十年中,职位增长率超过人口增长率 420% [2][3] - 物理 AI 对于解决休闲、酒店、医疗保健、建筑、交通运输、制造业等行业的问题至关重要,这些行业不能仅靠像 ChatGPT 这样的聊天机器人来解决 [3][4] - 英伟达 Project Groot 是将人形机器人和其他形式的机器人技术引入世界的战略,涵盖了计算基础设施、软件和所需的研究 [11] Robotics Foundation Model & Technology - 英伟达的 GR 101 机器人基础模型是开源且高度可定制的,其一大特点是跨具身性,该模型包含 20 亿参数 [1][12] - 机器人数据策略包括:少量且昂贵的真实世界数据(机器人执行真实任务),大量非结构化的互联网视频数据(人类解决任务),以及理论上无限的合成数据 [14][16][17][18] - Project Groot 的数据解决方案包括数据金字塔策略,强调通过模拟和世界基础模型来增强和倍增高质量数据 [13][18][19] - Groot N1 系统引入了双系统架构,系统一快速执行任务(120 赫兹),系统二缓慢规划复杂任务,灵感来源于 Daniel Kahneman 的《思考快与慢》 [23][24][25] - Groot N1 采用扩散 Transformer 块,结合视觉编码器、VLM(视觉语言模型)和文本分词器处理图像和文本输入,并通过动作解码器生成可用于特定机器人的动作向量 [27][28][29][30] - 机器人学习的两种主要方式是模仿学习(通过复制人类专家)和强化学习(通过试错最大化奖励),Groot N1 结合使用了这两种方法 [32][33][36] Deployment & Compute Infrastructure - 物理 AI 生命周期包括生成数据、使用数据和部署,英伟达称之为“三大计算机问题”,涉及不同计算特征:模拟阶段(OVX Omniverse),训练阶段(DGX),边缘部署阶段(AGX) [9][10]