Workflow
通用具身智能体
icon
Search documents
震撼,英伟达新模型能打遍几乎所有游戏
机器之心· 2025-12-21 04:21
这流畅的游戏动作,简直堪比是技术流游戏玩家的实况画面。尤其是茶杯头的躲避跳跃踩灵魂一气呵成,让我们自愧不如。我要有这么快的反应和操作水准,玩 丝之歌真不至于红温。 最令人震撼的是,上面视频里的操作完完全全是 AI 操作出来的。 和传统的游戏自动化脚本不同,这是一个完整的通用的大模型,不仅限于单一游戏的操作,能够玩遍市面上几乎全部的游戏类型。 于是,让我们正式介绍主角,来自 英伟达的最新 开源基础模型 N itroGen 。 编辑|冷猫 话不多说,先给大家看个视频。 该模型的训练目标是玩 1000 款以上的游戏 —— 无论是 RPG、平台跳跃、吃鸡、竞速,还是 2D、3D 游戏,统统不在话下! 模型直接以游戏视频帧作为输入,输出真实的手柄操作信号,天然适配所有支持手柄的游戏。NitroGen 支持后训练,意味着当它面对一款从未见过的新游戏时, 并不需要从零开始学习规则,只需少量微调或轻量适配,就能迅速上手,真正具备了 跨游戏泛化 的潜力。 项目地址: https://nitrogen.minedojo.org 论文地址: https://nitrogen.minedojo.org/assets/document ...
北大发布 ManualVLA:首个长程「生成–理解–动作」一体化模型,实现从最终状态自主生成说明书并完成操纵
机器之心· 2025-12-18 09:08
视觉–语言–动作(VLA)模型在机器人场景理解与操作上展现出较强的通用性,但在需要明确目标终态的长时序任务(如乐高搭建、物体重排)中,仍难 以兼顾高层规划与精细操控。 针对这一问题, 北京大学、香港中文大学与至简动力 团队提出了全新的「生成–理解–动作」一体化模型 ManualVLA。 首先由「规划专家」生成由图像、空间位置提示和文字说明组成的多模态操作说明书,再通过显式与隐式相结合的「思维链」(ManualCoT)推理,将信 息反馈给「动作专家」,为每一步操作提供清晰的显式控制条件的同时,通过潜在表征为动作生成提供持续的隐式引导,实现理解与生成的高度统一。 论文题目 :ManualVLA: A Unified VLA Model for Chain-of-Thought Manual Generation and Robotic Manipulation 论文链接 : https://arxiv.org/abs/2512.02013 项目主页 : https://sites.google.com/view/maunalvla 实验结果表明,ManualVLA 在现实场景任务中表现出显著优势,其平均成功率相较 ...
星动纪元端到端原生机器人大模型ERA-42亮相,引领具身大模型进入灵巧操作时代
IPO早知道· 2024-12-24 02:56
值得一提的是, 这是业界首次仅通过同一个具身大模型就实现了五指灵巧手像人手一样使用多种工 具完成上百种灵巧复杂操作任务 。模型不需要任何预编程技能,完全基于其强大的泛化和自适应 力,能在不到2小时内通过收集少量数据就学会执行新的任务。同时,ERA-42还在快速不断学习更 多新技能中。 此外, ERA-42也是世界范围内首个真正的五指灵巧手具身大模型,开启了具身大模型的通用灵巧 操作时代 。星动纪元打造的端到端原生机器人大模型ERA-42凭借其预测能力,模型具备强大的泛 化、自适应和规模化能力。结合星动纪元为AI打造的全新硬件平台,可快速实现具身智能体软硬件协 同进化和商业化落地。 1、相比夹爪,星动XHAND1已经可以完成100多种精细化、智能化的复杂灵巧操作任务;2、星动 纪元原生机器人大模型ERA-42能理解物理世界和预测未来;3、星动纪元原生机器人大模型ERA- 42具备更强泛化能力;4、星动纪元原生机器人大模型ERA-42具备更强自适应性;5、星动纪元原 生机器人大模型ERA-42初步体现"Scaling效应"。 当然, 构建通用具身智能体需要软硬件协同迭代,就像人类的脑和身体是从小到大同步协同成长的 ...