Workflow
模态编码
icon
Search documents
具身空间数据技术的路线之争:合成重建VS全端生成
量子位· 2025-04-20 13:24
生境科技投稿 量子位 | 公众号 QbitAI 具身智能的突破离不开高质量数据。 现实数据采集成本实在太高,于是,合成数据的技术就显得尤为重要。 目前,具身合成数据有两条主要技术路线之争: "视频合成+3D重建"or "端到端3D生成" 。 参考自动驾驶的成功经验,前者模态转换链路过长容易导致误差累积;后者"直接合成3D数据"理论上有信息效率优势,但需要克服"常识欠 缺"等挑战。 英伟达在CES 2025指出"尚无互联网规模的机器人数据",自动驾驶已具备城市级仿真,但家庭等复杂室内环境缺乏3D合成平台。 △ "没有数据,就创造数据。" NVIDIA Cosmos World Foundation Models, CES 2025 为解决"常识欠缺"困境,沿用"端到端三维生成"的技术路径,本文提出 "模态编码" 的全新技术解决方案:打破"排布=几何"旧范式,将空间方 案本身进行数字化编码、特征提取以及隐式学习。 结合强化学习策略,探索一种新的可能:不仅生成空间,更生成"可被理解与使用"的空间。 数据困境 眼下的现实是,具身智能的数据,不但少,而且不够用。 具身智能的现实挑战 智能困境:强身体,弱大脑 在机器人的 ...