Workflow
Cosmos世界模型
icon
Search documents
英伟达为机器人推出懂推理的“大脑”!升级版Cosmos世界模型来了
具身智能之心· 2025-08-14 00:03
编辑丨 量子位 点击下方 卡片 ,关注" 具身智能之心 "公众号 >> 点击进入→ 具身 智能之心 技术交流群 更多干货,欢迎加入国内首个具身智能全栈学习社区 : 具身智能之心知识星球 (戳我) , 这里包含所有你想要的。 老黄看好机器人,还真不是嘴上说说! 这不,就在正在举办的SIGGRAPH (计算机图形学) 大会上,英伟达为机器人带来了 全新升级的Cosmos世界模型 。 还是先来看看具体都有哪些更新。 软件层面,仅7B大小的Cosmos Reason尤为值得一提。 Cosmos主要被用来生成符合现实世界物理规律的合成数据,自发布以来,已被Figure、Agility Robotics、通用汽车等一众知名机器人和自 动驾驶公司采用。 这次升级重点聚焦在 规划能力 和 生成速度 两大方面: 除了软件更新,英伟达还几乎全面升级了机器人开发配套技术与硬件——包括全新的Omniverse库、RTX PRO Blackwell服务器,以及DGX Cloud云平台等。 英伟达人工智能研究副总裁Sanja Fidler表示: AI正在提升我们的模拟能力,而模拟能力也在推动AI系统的发展。 这两个领域之间存在着真实而强 ...
快讯|浙大四足机器人破吉尼斯世界纪录;英伟达推出专为机器人设计的新Cosmos世界模型;西工大新型电活性聚合物的多功能机器人等
机器人大讲堂· 2025-08-13 10:47
1、 浙江大学四足机器人"白犀"破吉尼斯世界纪录 在浙江杭州的一片测试场地上,一头银白色合金骨架的"机械猛兽"如离弦之箭般飞驰而出……8月12日, 记者从吉尼斯世界纪录获悉,由浙江大学交叉力学中心(XMECH)自主研发的高机动四足机器人"白 犀"以16.33秒完成百米冲刺,刷新"四足机器人最快的100米"吉尼斯世界纪录。团队建立了精密的动力学 模型,并使用多目标优化算法来协同调整机器人的几何比例、电机规格和减速系统。动力系统方面,浙江 大学交叉力学中心自主研发了一套高功率密度关节驱动器,既能输出强大扭矩,又能实现快速响应,这就 像给"白犀"安装了一套"赛车级"的肌肉系统。而真正赋予它智能运动能力的,是基于强化学习算法的动态 控制策略。未来,"白犀"将被进一步拓展应用场景:从灾害救援到极端地形运输,它的意义也将从"跑得 快"延伸到"跑得有用"。 2、 英伟达推出新型Cosmos世界模型,专为机器人和实体应用而设计 日前,英伟达公布了一套面向机器人开发者的全新世界人工智能模型、库及其他基础设施,其中最引人注 目的是Cosmos Reason,这是一款拥有70亿参数的"推理"视觉语言模型,适用于实体人工智能应用和机 ...
英伟达为机器人推出懂推理的“大脑”!升级版Cosmos世界模型来了
量子位· 2025-08-12 09:35
一水 发自 凹非寺 量子位 | 公众号 QbitAI 老黄看好机器人,还真不是嘴上说说! 这不,就在正在举办的SIGGRAPH (计算机图形学) 大会上,英伟达为机器人带来了 全新升级的Cosmos世界模型 。 Cosmos主要被用来生成符合现实世界物理规律的合成数据,自发布以来,已被Figure、Agility Robotics、通用汽车等一众知名机器人和自 动驾驶公司采用。 这次升级重点聚焦在 规划能力 和 生成速度 两大方面: 除了软件更新,英伟达还几乎全面升级了机器人开发配套技术与硬件——包括全新的Omniverse库、RTX PRO Blackwell服务器,以及DGX Cloud云平台等。 英伟达人工智能研究副总裁Sanja Fidler表示: AI正在提升我们的模拟能力,而模拟能力也在推动AI系统的发展。 这两个领域之间存在着真实而强大的结合,这种结合很少有人能做到。 如今,英伟达正凭借一整套机器人开发基础设施,全力冲击这一融合新高地。 推出Cosmos Reason :一款70亿参数、具备推理能力的视觉语言模型,可帮助机器人进行任务规划; 新增Cosmos Transfer-2&精简版 :加速 ...
腾讯加码空间智能大模型,这一赛道正在成为下一个风口
首席商业评论· 2025-08-09 04:17
混元3D模型有什么不同 这次更新的空间模型能力堪称炸裂。 腾讯混元团队也从定量角度评估混元世界模型 1.0 性能,针对 360° 全 景与 3D 场景生成能力,与开源或者开放接口工作进行了对比,包括纹理细节、美学质量、指令遵循等评价 维度,结果显示,混元世界模型 1.0 在生成质量上全面超过了 SOTA 开源模型。 与此同时,腾讯混元还宣布了一系列后续开源计划,包括多模态理解模型、游戏视觉模型,以及适用于边 缘设备的端侧大语言模型(0.5B、1.8B、4B、7B),覆盖从 3D 世界生成到小模型部署的完整生态链条。这 一次,腾讯不仅把 3D 内容生成从「生成一个物体」升级到「生成一个世界」,还希望以开源的方式,撬动 整个3D AIGC 创作生态。 那么从普通用户可感知的角度这事有什么可聊的呢? 混元模型可基于一句文本描述或一张图像输入,生成一个 360 度沉浸式的三维场景。例如,你只需输入 「一个破旧的加油站,夜晚下着雨,远处有霓虹灯」,它就能构建出加油站主体、环境、天空光照、闪电 等元素构成的完整空间。 2018年电影《头号玩家》横空出世,一个完全虚拟但又有较为真实体验的世界,拉开了元宇宙世界的序 幕,依靠 ...