李飞飞与NVIDIA联合提出了能够实时推理的3D操作基座模型
点击下方 卡片 ,关注" 具身智能 之心 "公众号 项目链接:point-world.github.io 核心亮点:3D 点流统一状态 - 动作表征、500 小时跨域数据集、实时 0.1s 推理、零样本真实机器人操纵 问题根源:野生环境 3D 世界建模的四大核心挑战 作者丨 Wenlong Huang等 编辑丨具身智能之心 本文只做学术分享,如有侵权,联系删文 >> 点击进入→ 具身智能之心 技术交流群 更多干货,欢迎加入国内首个具身智能全栈学习社区 : 具身智能之心知识星球 (戳我) , 这里包含所有你想要的。 在机器人学与计算机视觉领域,人类仅凭一瞥和动作预判就能感知 3D 世界的物理响应,但现有技术难以在真实野生环境中实现精准的动态预测与操纵。 斯坦福大学与 NVIDIA 联合团队提出的 PointWorld 框架 ,以 "3D 点流统一表征" 为核心,通过 "大规模数据集构建 - 世界模型设计 - 实时操纵部署" 的三层技 术体系,首次实现单一预训练模型在真实场景下的多类型物体操纵,为通用机器人技术提供了全新范式。 论文题目:PointWorld: Scaling 3D World Models fo ...