SpatialLM

Search documents
具身空间数据技术的路线之争:合成重建VS全端生成
量子位· 2025-04-20 13:24
生境科技投稿 量子位 | 公众号 QbitAI 具身智能的突破离不开高质量数据。 现实数据采集成本实在太高,于是,合成数据的技术就显得尤为重要。 目前,具身合成数据有两条主要技术路线之争: "视频合成+3D重建"or "端到端3D生成" 。 参考自动驾驶的成功经验,前者模态转换链路过长容易导致误差累积;后者"直接合成3D数据"理论上有信息效率优势,但需要克服"常识欠 缺"等挑战。 英伟达在CES 2025指出"尚无互联网规模的机器人数据",自动驾驶已具备城市级仿真,但家庭等复杂室内环境缺乏3D合成平台。 △ "没有数据,就创造数据。" NVIDIA Cosmos World Foundation Models, CES 2025 为解决"常识欠缺"困境,沿用"端到端三维生成"的技术路径,本文提出 "模态编码" 的全新技术解决方案:打破"排布=几何"旧范式,将空间方 案本身进行数字化编码、特征提取以及隐式学习。 结合强化学习策略,探索一种新的可能:不仅生成空间,更生成"可被理解与使用"的空间。 数据困境 眼下的现实是,具身智能的数据,不但少,而且不够用。 具身智能的现实挑战 智能困境:强身体,弱大脑 在机器人的 ...
深度|具身合成数据的路线之争,谁将率先走出困境?
Z Potentials· 2025-04-08 12:30
" 没有数据,就创造数据。 "NVIDIA Cosmos World Foundation Models, CES 2025 NVIDIA Cosmos World Foundation Models, CES 2025 摘要 本文主要描述了具身合成数据两条主要技术路线之争: " 视频合成 +3D 重建 " or " 端到端 3D 生成 " 。参考自动驾驶的成功经验,前者模态转换链路过长 导致误差累积, ' 直接合成 3D 数据 ' 理论上有信息效率优势,但需要克服 " 常识欠缺 " 等挑战。 眼下,机器人流行视频中高难度动作(空翻、跳舞、格斗等)主要依靠 遥控 / 预设编程完成的。 机器人 逐渐完善了 自身运动控制能力 ,然而对外环境感 知、推理能力有待完善。 数据是 AI 时代的石油。具身智能的突破高度依赖于数据驱动的训练。由于现实数据采集成本高,合成数据被推上了前台。它不只是 " 虚拟的替代品 " ,更 可能是具身智能迈向通用能力的关键推动力。英伟达在 CES 2025 指出 " 尚无互联网规模的机器人数据 " ,自动驾驶已具备城市级仿真,但家庭等复杂室内 环境缺乏 3D 合成平台。 为解决 " 常识欠 ...
陆家嘴财经早餐2025年3月29日星期六
Wind万得· 2025-03-28 22:36
// 热点聚焦 // 1、国家领导人会见国际工商界代表。领导人指出, 中国对外开放的大门只会越开越大,利用外资的政策没有变也不会变。 中国过去是、现在是、将来也 必然是外商理想、安全、有为的投资目的地,与中国同行就是与机遇同行,相信中国就是相信明天,投资中国就是投资未来。 2、 证监会修改《证券发行与承销管理办法》,增加银行理财产品、保险资产管理产品作为IPO优先配售对象 ,明确由证券交易所制定IPO分类配售具体 规定, 禁止参与IPO战略配售的投资者在承诺的限售期内出借股份 。沪深交易所同步修订发行承销业务实施细则。 3、美联储最爱通胀指标反弹! 美国2月核心PCE物价指数同比上涨2.8%,超过预期的2.7%和前值2.6%;环比则上涨0.4%,超出预期和前值0.3%,创 2024年1月以来新高。 2月个人支出环比仅增长0.1%,收入却增长0.8%。数据引发市场对顽固通胀以及潜在滞胀的担忧,交易员继续押注美联储在7月进行 降息。 4、 就"长和拟向贝莱德出售巴拿马港口"一事,市场监管总局反垄断二司负责人表示,注意到此交易,将依法进行审查 ,保护市场公平竞争,维护社会公 共利益。 // 环球市场 // 1、 美 ...
群核科技亮相GTC,创始人黄晓煌回应卖英伟达股票创业:光谈钱就没意思了
IPO早知道· 2025-03-21 11:52
这是一个基于大语言模型的3D场景语义生成框架 ——其 突破了传统大语言模型对物理世界几何与 空间关系的理解局限,赋予机器类似人类的空间认知和解析能力。 这相当于为具身智能领域提供了 一个基础的空间理解训练框架,企业可以针对特定场景对SpatialLM模型微调,降低具身智能训练门 槛。 群核科技董事长黄晓煌 表示: "我们希望打造一个从空间认知理解到空间行动交互闭环的具身智能 训练平台。本次开源的SpatialLM空间理解模型旨在帮助具身智能机器人完成在空间认知理解上的基 础训练。而去年群核科技发布的空间智能解决方案SpatialVerse,则希望进一步通过合成数据方案 为机器人搭建最接近物理真实的'数字道场',实现机器人在仿真环境中的行动交互训练。" 从GPU高性能计算到具身智能训练。 本文为IPO早知道原创 作者|Stone Jin 微信公众号|ipozaozhidao 据 IPO 早 知 道 消 息 , 群 核 科 技 于 3 月 19 日 在 GTC2025 全 球 大 会 上 宣 布 开 源 空 间 理 解 模 型 SpatialLM。 在空间和具身智能训练上,目前群核科技已与硅谷头部科技企业等在内的 ...