通用具身智能

Search documents
百万规模数据集打造人形机器人通用大模型,实现精细动作跨平台、跨形态动作迁移丨北大人大联合发布
量子位· 2025-05-14 08:55
北大卢宗青团队 投稿 量子位 | 公众号 QbitAI 北大和人大团队在通用人形机器人动作生成领域取得重大突破! 首创性地提出了具备数据-模型协同放量 (Scaling Law) 特性的 通用动作生成框架Being-M0 。 通过大规模互联网视频,构建了业界 首个百万规模的动作生成数据集MotionLib 。 又基于此数据集,研发了端到端的文本驱动动作生成模型,实现了具备规模效应的复杂、多样的人类动作生成,做到了人体动作向多类型人形 机器人的动作迁移。 文章将发表于ICML2025。 创新点 百万级动作数据集MotionLib Being-M0团队构建了业界首个突破百万规模的动作生成数据集,并建立了从原始视频到高质量动作数据的全自动化处理流程,大幅提升 了数据获取效率。 在人工智能领域,数据规模的突破往往能带来模型性能质的飞跃。 为构建大规模动作数据集,Being-M0团队从公开数据集和在线平台系统性地收集了超过2000万段人体动作视频。面对海量的互联网视频数 据,如何实现高质量动作数据的自动化提取成为了关键挑战。 为此,Being-M0团队开发了一套创新的数据处理流水线: 首先,基于预训练模型进行2D人体关 ...
北京一季度产业经济亮点纷呈:增长强劲、创新加速、信心攀升
Xin Jing Bao· 2025-04-28 11:00
Group 1 - The core viewpoint of the news highlights the positive economic performance of Beijing in the first quarter of the year, driven by strong industrial growth and innovation [1][3]. - Beijing's industrial and information software sector's added value exceeded 400 billion yuan, contributing nearly 3 percentage points to the city's GDP growth of 5.5% [3][4]. - The automotive manufacturing and electronic information industries experienced significant growth, with increases of 17.2% and 28% respectively [3][4]. Group 2 - Major projects such as the Beijing-Tianjin-Hebei New Energy Vehicle Technology Ecological Park have been launched, with industrial investment growth of 23.1% in the first quarter [4]. - The export delivery value of Beijing's industrial enterprises surpassed 50 billion yuan, marking a three-year high, with notable growth in the automotive and electrical machinery sectors [4]. - The profit growth of the information software industry reached 37.5% in the first two months of the year, indicating a strong recovery in market confidence [4].
谷歌VS Figure AI VS成都:人形机器人的“脑”力角逐
机器人大讲堂· 2025-04-22 08:28
全球人形机器人产业正迎来"大脑"技术革命,2025年开年短短三个月内,美国机器人初创公司Figure AI 和谷歌DeepMind都先后公布了各自的通用具身智能大模型,同时,中西部首个人形机器人创新中心—— 成都人形机器人创新中心,也发布了国内首个基于3DSGs的人形机器人规划推理执行系统Raydiculous— 1。 谷歌DeepMind、Figure AI与成都创新中心 正以不同技术路径争夺产业标准话语权,人形机器人 的"脑"力角逐已经拉开帷幕。 ▍谷歌Deep Mind:具身大模型的"通用智能野心" Gemini Robotics 主要有三个方面的提升: 泛化性: Gemini Robotics 是一款 基于视觉-语言-动作(VLA)的端到端模型 ,能够处理全新的、训练 中从未遇到过的任务。例如,向机器人展示一个小型玩具篮球和篮网,并指示"灌篮",尽管此前从未接 触过这些物体,但仍然理解了指令并完成了动作。Deep Mind称其泛化能力比现有模型提高了一倍。 而 Gemini Robotics-ER 是一款 视觉- 语言模型(VLM) ,专注于增强 空间推理 能力。例如,面对咖 啡杯时,它能识别适合抓取 ...
人形机器人半马冠军,为什么会选择全尺寸?
量子位· 2025-04-20 13:24
全球首个 人形机器人半程马拉松在北京亦庄开跑,足足 21公里 。 火爆程度,就连 央视 都现场直播,话题更是冲上了 微博热搜 。 这次半马,一共有 20个 人形机器人与1.2万人类共同参赛,而在比赛开始 2小时40分42秒 之后,这个"全球首个"的比赛冠军诞生了—— 来自北京人形机器人创新中心的全尺寸人形机器人—— 天工Ultra 。 金磊 一水 发自 凹非寺 量子位 | 公众号 QbitAI 真·见证历史了。 是直接 打破世界纪录 的那种! 要知道,在这将近3个小时的时间里,天工Ultra全程是没有遥控的,而是使用了无线领航技术完成跟随导航和长程路径规划。 值得注意的是,天工Ultra是用同一台机器人完成了整个比赛,全程没有替换机器人。 不仅如此,天工Ultra自身身高达到了1.8米,体重55kg,对人形机器人来说,身高体重每增加一点,那么其技术难度可以说是指数级增加。 而天工Ultra属于所有参赛"选手"中身高 最高 的那一个(最矮的仅75厘米),这一全尺寸人形机器人设计方案带来了多重技术挑战。 首先,整体重心的显著上移对系统稳定性提出了更高要求;其次,关节驱动系统必须同步升级以适应倍增的扭矩需求和更强的 ...
星动纪元端到端原生机器人大模型ERA-42亮相,引领具身大模型进入灵巧操作时代
IPO早知道· 2024-12-24 02:56
值得一提的是, 这是业界首次仅通过同一个具身大模型就实现了五指灵巧手像人手一样使用多种工 具完成上百种灵巧复杂操作任务 。模型不需要任何预编程技能,完全基于其强大的泛化和自适应 力,能在不到2小时内通过收集少量数据就学会执行新的任务。同时,ERA-42还在快速不断学习更 多新技能中。 此外, ERA-42也是世界范围内首个真正的五指灵巧手具身大模型,开启了具身大模型的通用灵巧 操作时代 。星动纪元打造的端到端原生机器人大模型ERA-42凭借其预测能力,模型具备强大的泛 化、自适应和规模化能力。结合星动纪元为AI打造的全新硬件平台,可快速实现具身智能体软硬件协 同进化和商业化落地。 1、相比夹爪,星动XHAND1已经可以完成100多种精细化、智能化的复杂灵巧操作任务;2、星动 纪元原生机器人大模型ERA-42能理解物理世界和预测未来;3、星动纪元原生机器人大模型ERA- 42具备更强泛化能力;4、星动纪元原生机器人大模型ERA-42具备更强自适应性;5、星动纪元原 生机器人大模型ERA-42初步体现"Scaling效应"。 当然, 构建通用具身智能体需要软硬件协同迭代,就像人类的脑和身体是从小到大同步协同成长的 ...
「星动纪元」完成近3亿元Pre-A融资,致力于打造原生通用具身智能体
IPO早知道· 2024-10-17 13:15
自2023年8月成立1年以来完成的第三轮融资。 星动纪元的原生机器人大模型是一种AI原生的全新学习范式,兼具极致的通用性和简洁性,并具备充 分Scale-Up的能力。 其算法通过全模态输入融合处理视觉、听觉、触觉等感官信息,重现了有机 体与物理世界最本源的交互方式。这种原创设计不仅还原了自然交互的本质,还增强了跨模态信息处 理能力,使智能体能够更全面、灵活地感知和理解环境。在通用性方面,星动纪元秉持"the bitter lesson"理念,让机器人摒弃了人类先验,通过自我探索和自我学习,实现真正的自主进化与广泛应 用。在简洁性方面,公司采用端到端架构,使智能体能够实时适应任务和环境,无需复杂的编程或人 工干预,大幅提升灵活性与开发效率。 在刚刚结束的2024年世界机器人大会上,公司发布了第六代人形机器人STAR 1和灵巧手XHAND 1,展示了卓越的硬件创新能力。包括XHAND在内的所有核心部件均为自主研发,相较于一年前的 第三代"小星",STAR 1的自由度从20个提升至55个,支持更复杂的人形姿态。其关节扭矩从 150N·m提升至400N·m,关节转速达到25rad/s,性能已达世界顶尖水平。STAR ...