Workflow
具身智能之心
icon
Search documents
实力出圈,43秒搞定工业任务!拎桶分拣惊艳全场。
具身智能之心· 2025-11-21 04:01
本公众号是北京灵御智能科技有限公司官方公众号 11 月 19 日, 202 5 年第二届中关村具身智能机器人应用大赛 颁奖典礼圆满落幕。作为北京市海淀区打造全球具身智能创新策源地的核心赛事,本届大 赛以 "具身引智、应用未来" 为主题,汇聚全球 157 支顶尖团队同台竞技,200 万奖金激励技术突破与场景落地。北京灵御智能科技有限公司(简称 "灵 御智能")携 自主研发 TeleAvatar 机器人 ,参与第二赛道 具身智能场景应 用赛遥操作模式 角逐,最终 在报名的 7 个细分赛项中全部斩获一等奖 ,以硬 核实力在这场高规格赛事中脱颖而出。 大赛背景:聚焦应用,搭建产业创新舞台 本届大赛由中关村科学城管委会主办,北京市科学技术委员会中关村科技园区管理委员会、北京市经济和信息化局指导,北京智源人工智能研究院等单位 承办协办。赛事设置三大赛道,构建总额 200 万元的差异化奖励体系,旨在 推动具身智能技术从算法突破走向场景落地,搭建 "技术竞技与成果转化" 于 一体的产业平台 。 灵御智能瞄准场景应用核心需求,报名参与了遥操作模式下 家庭服务 、 工业制造 、 安全处置 三大场景的 7 个细分赛项,覆盖 物料搬 ...
GEN-0 以及后续的 VLA 发展的看法
具身智能之心· 2025-11-21 00:04
作者丨 阿汐猫猫 原文链接 | https://zhuanlan.zhihu.com/p/1970094649956868665 点击下方 卡片 ,关注" 具身智能之心 "公众号 >> 点击进入→ 具身 智能之心 技术交流群 更多干货,欢迎加入国内首个具身智能全栈学习社区: 具身智能之心知识星球(戳我) ,这里包含所有你 想要的! 文章转载自博客,见 https://axi404.top/blog/embodied-talk-3 前言 最近 GEN-0[1] 的发布对于具身智能领域可以说是轰动性的。Manipulation 作为 Robotics 领域一直以来皇冠上 的明珠,并且作为具身智能带来现实生产力必不可少的一环,一向以泛化的困难性著称。由于缺乏实际的使 用场景,缺乏数据飞轮导致的数据匮乏使得模型的预训练难以 scaling up,而模型高度依赖后训练的数据。 在此之前,领域内最具代表性的工作莫过于 Pi 系列[2][3],在 Pi dataset 私有数据集上进行预训练。其结果是 显著的,使用此类预训练之后,带来了模型后训练时的性能提升。从实际部署中,Pi 不同于若干号称反超自 己的模型,在动作连贯性 ...
分割一切并不够,还要3D重建一切,SAM 3D来了
具身智能之心· 2025-11-21 00:04
更多干货,欢迎加入国内首个具身智能全栈学习社区: 具身智能之心知识星球(戳我) ,这里包含所有你想要的! 沉默后爆发? 编辑丨 机器之心 点击下方 卡片 ,关注" 具身智能之心 "公众号 >> 点击进入→ 具身 智能之心 技术交流群 深夜,Meta 有了重大更新,接连上线 SAM 3D、SAM 3(Segment Anything Model,SAM)。 其中,SAM 3D 是 SAM 系列的最新成员,它将人们对图像的 3D 理解带入通俗易懂的世界,其包含两个模型: 这两个模型都具备强大且稳定的 SOTA(业界领先)性能,能够将静态的 2D 图像转化为细致的 3D 重建结果。 SAM 3D Objects:支持物体与场景重建 SAM 3D Body:专注于人体形状与姿态估计 SAM 3 可通过文本、示例和视觉提示,对图像和视频中的物体进行检测、分割与跟踪。 作为本次发布的一部分,Meta 同步开放了 SAM 3D、SAM 3 的模型权重与推理代码。 此外,Meta 还推出了一个全新平台 Segment Anything Playground,通过该平台,用户能轻松体验 SAM 3D、SAM 3 的能力。 接下 ...
VLA+RL方向的同学可以看过来了~
具身智能之心· 2025-11-21 00:04
点击下方 卡片 ,关注" 具身智能 之心 "公众号 最近收到社区内很多同学关于VLA和RL相关内容的咨询,也希望具身智能之心能够有更深入的讲解。在 此,我们向全平台粉丝招募VLA+RL方向的课程&项目辅导老师,和我们一起输出最有料的内容。 具身智能之心是国内首个具身全栈技术交流社区,聚集了大量VLA和RL相关方向的同学。 我们将提供高于行业平均水平的薪酬以及丰富的行业资源。 详细内容欢迎添加微信:oooops-life咨询。 一些要求 需是VLA+RL的研究方向,学术界我们希望是博士及以上(包含在读),手握相关方向的顶会。工业界希 望您有一定的实战经验和真机调试经验。 待遇说明 ...
南洋理工大学提出NORA-1.5:一种基于世界模型与动作奖励的VLA模型
具身智能之心· 2025-11-21 00:04
点击下方 卡片 ,关注" 具身智能 之心 "公众号 作者丨 Chia-YuHung等 编辑丨具身智能之心 本文只做学术分享,如有侵权,联系删文 >> 点击进入→ 具身智能之心 技术交流群 更多干货,欢迎加入国内首个具身智能全栈学习社区 : 具身智能之心知识星球 (戳我) , 这里包含所有你想要的。 南洋理工大学等研究单位提出NORA-1.5 通过集成流匹配动作专家与奖励驱动的直接偏好优化(DPO)后训练,解决了现有视觉-语言-动作(VLA)模型泛化性和 可靠性不足的问题,在仿真与真实机器人场景中均实现了当前最优性能。 核心定位与解决的关键问题 架构设计:流匹配与 VLA backbone的协同优化 VLA backbone基础 论文标题 :NORA-1.5:AVision-Language-ActionModelTrainedusingWorldModel andAction-basedPreferenceRewards 论文链接 :https://arxiv.org/pdf/2511.14659 ProjectPage :https://declare-lab.github.io/nora-1.5 Code ...
坚持“具身大脑”与“人形本体”软硬⼀体!这家具身公司再获10亿融资
具身智能之心· 2025-11-20 10:52
作者丨星动纪元 星动纪元提供面向开发者及企业的开发工具及行业解决方案,国内聚焦具身智能行业解决方案应用,国外主攻开发者市场,形成 " 国内深耕 + 海外拓展 " 的业务格 局。得益于这种多元化的商业布局,星动纪元 2025 年商业化高速增长。 国内聚焦具身智能行业解决方案应用,与 吉利、雷诺、顺丰、 TCL 、海尔、联想、世纪金源 等企业达成深度合作。其中,物流行业最大单笔订单近五千万,已形 成标准化解决方案。 其中海外业务占比 50% , 全球 TOP10 市值科技巨头中 9 家为星动纪元客户 。海外业务覆盖北美、欧洲、中东、日韩,并成为 SKILD AI 、字节跳动、 MIT 、 Stanford 、清华、北大等全球顶尖机构的首选。 编辑 | 机器人大讲堂 点击下方 卡片 ,关注" 具身智能之心 "公众号 >> 点击进入→ 具身 智能之心 技术交流群 更多干货,欢迎加入国内首个具身智能全栈学习社区: 具身智能之心知识星球(戳我) 2025 年 11 月 20 日,星动纪元完成近 10 亿元 A+ 轮融资。本轮融资由吉利资本领投,北汽产投战略投资,北京市人工智能产业投资基金及北京机器人产业发展 投资基金联合 ...
港中文最新!无需微调即可部署VLA模型
具身智能之心· 2025-11-20 04:02
点击下方 卡片 ,关注" 具身智能 之心 "公众号 作者丨 Zhuo Li等 编辑丨具身智能之心 本文只做学术分享,如有侵权,联系删文 >> 点击进入→ 具身智能之心 技术交流群 更多干货,欢迎加入国内首个具身智能全栈学习社区 : 具身智能之心知识星球 (戳我) , 这里包含所有你想要的。 现有问题分析 VLA模型在现实世界机器人操作任务中展现出巨大潜力。然而,预训练的VLA策略在下游部署过程中仍会出现显著的性能下降。尽管微调可以缓解这一问题,但它 依赖于高昂的演示数据收集成本和密集型计算,在现实场景中并不实用。这里提出了VLA-Pilot,一种即插即用的推理时策略引导方法,无需额外微调或数据收集, 即可实现预训练VLA模型的零样本部署。 在两种不同机器人形态的六个现实世界下游操作任务中对VLA-Pilot进行了评估,涵盖分布内和分布外场景。实验结果表明,VLA-Pilot大幅提升了现成预训练VLA 策略的成功率,实现了对多样化任务和机器人形态的稳健零样本泛化。 实验视频和代码:https://rip4kobe.github.io/vla-pilot/。 背景介绍&创新点 近年来,VLA模型的进步显著提升了机 ...
从纯小白到具身算法工程师的打怪之路
具身智能之心· 2025-11-20 04:02
今天有个老学员,拿到了某头部的offer,自笑到从纯小白到算法工程师的打怪之路着实不简单,但真的有 门路。从自己购买so-100折腾,到后面跟着系统的路线一起学习,不仅节省了很多时间,也避免陷入了较 多的坑里。 这里也为大家推荐几个具身方向的研究路线:涉及vla、vln、diffusion policy、强化学习等。也欢迎扫码直 接学习: vla方向 VLA构成的机器人系统主要包括:视觉的感知处理模块,语言指令的理解以及生成机器人可执行动作的策 略网络。根据不同的需求,目前的VLA主要分为三类范式:显示端到到VLA,隐式端到端VLA以及分层端 到端VLA。 显示端到到VLA,是最常见最经典的范式。通常是将视觉语言信息压缩成联合的表征,然后再基于这个表 征去重新映射到动作空间,生成对应的动作。这类端到端的范式依赖于先前广泛的研究先验,通过不同架 构(diffusion/ transformer/dit),不同的模型大小,不同的应用场景(2d/3d),不同的任务需求(从头训/下 游微调),产生了各类不同的方案,取得了不错的性能。 隐式端到端VLA,则不同于前者,更加关注工作的可解释性,旨在利用当前的video d ...
世界第一「空间智能」引擎!苹果没做成的,95后博士拿下了
具身智能之心· 2025-11-20 00:03
编辑丨 新智元 点击下方 卡片 ,关注" 具身智能之心 "公众号 >> 点击进入→ 具身 智能之心 技术交流群 更多干货,欢迎加入国内首个具身智能全栈学习社区: 具身智能之心知识星球(戳我) ,这里包含所有你想要的! 【导读】 2024年以来,从苹果Vision Pro将「空间计算」推向巅峰,到Peloton Guide、Nex Playground等「AI摄像头」硬件开始在小规模市场 中验证可行性,风口已然初现。 一个共识正在全球科技行业悄然形成:AI驱动的体感交互是下一个浪潮。 但一个根本性的矛盾也随之暴露:前者价格高昂,动辄数千美元,将普罗大众拒之门外;后者虽然价格稍低,却仍需用户购买专属的硬件盒子,本质上 没有摆脱「外设」的束缚。 市场在呼唤一个更轻、更普惠的解决方案。 当我们回归真实的居家娱乐场景时,会发现用户体验是极度「割裂」的。 要么是花重金买来的游戏主机,在短暂的新鲜感过后,最终难逃在角落里「吃灰」的命运;要么是面对主机里那些同质化严重、缺乏实时反馈的游戏内 容。 这是一个消费者极度渴望互动,却被高昂硬件和贫瘠内容双重束缚的市场。 在此背景下,一家名为「飞拓星驰」(下文简称「FitX」)的中国 ...
从零将π0.5部署到具身机械臂上!
具身智能之心· 2025-11-20 00:03
支持pi0.5部署了~ 继上周把pi0任务打通后,现又支持了pi0.5部署,代码也会对客户正式开源,助力大家加速具身科研落地。 感兴趣的同学可以关注下~ 面向具身科研领域打造的轻量级高性价比机械臂 ✅ 提供全流程开源工具链+代码示例,从数据采集到模型部署一气呵成; ✅ 支持 Python / C++ 双语言接口,无论你擅长哪种语言都能快速上手; ✅ 兼容 ROS1 / ROS2,并提供 URDF 模型,仿真与真机无缝切换; ✅ 24小时快速售后响应,遇到问题不卡壳,学习路上有保障! 还在为具身智能领域的硬件选择发愁吗? 太贵的机械臂买不起,太便宜的又难用、难上手? 别担心,Imeta-Y1 来了——这是一款专为新手和科研初学者设计的轻量级高性价比机械臂。 无论你是学生、教育工作者,还是刚踏入机器人领域的开发者,Imeta-Y1 都能帮你低成本、高效率地完成 算法验证与项目开发。 对小白尤其友好的是: 该机械臂融合高精度运动控制、低功耗设计与开放软硬件架构,支持从仿真到真机的无缝联调,并提供全 流程开源SDK与工具链,助力用户快速实现算法验证、数据采集、模型训练与部署应用。 其紧凑型结构与模块化接口,尤其适用于 ...