具身智能之心
Search documents
星源智正在打造一双具身“会思考,能用的手”
具身智能之心· 2026-01-07 10:00
在本次活动上,征和工业正式发布了全球首创链式灵巧手——臻手・CHOHO Hand, 该产品兼具高承重、 高抗力、高可靠、高耐久、高精度、高能效、低自重、低成本八大核心优势,成就灵巧手行业全能"八边形 战士"。与星源智的合作,将借助后者在具身智能模型领域的技术优势, 为灵巧手注入自主感知、规划决策 和自适应能力 ,为人形机器人、协作机器人、机械臂等提供系统性末端泛化执行方案。同时,双方还将联 合开展灵巧手大模型的研发,推进在实际场景中的测试训练与迭代优化,确保技术与市场需求精准匹配。 在具身智能产业加速落地的关键阶段,机器人的高质量发展已超越"硬件+软件"的简单叠加,而是跨领域资 源整合、协同研发与优势互补的深度联动。此次星源智与征和工业的携手,实现了硬件性能与软件智能的 双向赋能,打通了灵巧手从技术创新到产业化应用的关键链路,为具身智能行业规模化落地按下"加速键"。 .... . . . . ® CHOHO 青岛征和工业股份有限公司 & 北京星源智机器人科技有限公司 签约仪式 CHOHO 星源 智 タり 存、 波 E > ALLA 点击下方 卡片 ,关注" 具身智能 之心 "公众号 1月6日," 具身智能灵巧 ...
为什么π系列对行业产生了这么大的影响?
具身智能之心· 2026-01-07 07:02
>> 点击进入→ 具身智能之心 技术交流群 点击下方 卡片 ,关注" 具身智能 之心 "公众号 编辑丨具身智能之心 本文只做学术分享,如有侵权,联系删文 但pi貌似不"听话",不好调,总是达不到预期效果。这个事情,是很多同学持续在吐槽的。不少同学说,相当多的时间"浪费"在踩 坑上了。 想要基于pi系列,完成数据、VLA模型训练优化、部署一整套任务,对很多初学者来说非常困难。有的同学甚至踩了半年坑都无法真的 入门,更不用说取得较好效果。 ★ 其模型能力引领通用机器人从实验室走向工业制造、家庭服务等实景应用,成为 2025 年来业界众多 VLA 模型的核心参考。学会 π 系列 模型,即掌握 VLA 模型的核心根基,更能为科研创新、求职就业、工业落地赋能添翼。 不少公司基于pi系列搭建自己的真机demo,比如叠衣服、拆箱子等,或基于这个思路改进优化。physical intelligence的每次新工作发布, 都会引起行业反响。 ★ 2024.10 π0:首创 Flow Matching 连续动作轨迹预测,突破传统离散动作精度瓶颈,为精密制造、自动驾驶等场景提供毫米级操作基础; 2025.04 π0.5:异构任务协 ...
会跳舞、能演讲!RoboPerform 让人形机器人听懂声音,即兴解锁双重技能
具身智能之心· 2026-01-07 07:02
点击下方 卡片 ,关注" 具身智能 之心 "公众号 作者丨 Zhe Li等 编辑丨具身智能之心 本文只做学术分享,如有侵权,联系删文 >> 点击进入→ 具身智能之心 技术交流群 更多干货,欢迎加入国内首个具身智能全栈学习社区 : 具身智能之心知识星球 (戳我) , 这里包含所有你想要的。 ★ 本文的主要作者来自北京智源人工智能研究院、哈尔滨工业大学、香港科技大学、上海交通大学、北京大学和悉尼大学。本文的第一作者为北京智源人工智能 研究院的实习生李哲,主要研究方向为具身智能和3D数字人。共同一作是哈尔滨工业大学的韦杨扬。本文的通讯作者为北京大学计算机学院研究员、助理教授 仉尚航和北京智源研究院研究员迟程。 行业痛点:多阶段流程带来的信息损失 当爵士乐的节拍响起,人形机器人即刻舒展肢体,抬手、转身、踏步精准踩中每一个鼓点;当演讲者的话音落下,它又能顺着语调的抑扬、话语的重音,自然抬 手、侧身、点头,用恰到好处的肢体语言强化表达。 这不是科幻电影里的片段,而是 RoboPerform 正在实现的现实。 它打破了人形机器人 "照本宣科" 的动作困境,既让机器能随音乐即兴起舞,也能配合语音生成自然手势,真正听懂声音的情 ...
从10,000小时到2天,灵初智能如何让数采效率狂飙200倍?
具身智能之心· 2026-01-07 03:33
点击下方 卡片 ,关注" 具身智能 之心 "公众号 当具身的上限被数据左右时,一定会有越来越高效的采集方案。这不仅仅是机器人领域的趋势,还是整 个以"数据为驱动"产业的基因。 具身智能行业有一个众所周知的困境,就是数据不够。 当具身智能的上限被数据锁死,一场关于"数采效率"的军备竞赛便成了必然。 这不仅是机器人学的技术演 进,更是所有"数据驱动型"产业刻在基因里的进化逻辑。 然而,理想与现实的鸿沟正横亘在每一位从业者面前。无论是基座模型还是规模化的高质量数据,都在一边 发展一边优化。 当前,在开发的不同阶段和需求下,我们看到具身智能行业大致形成了几种数采路线:UMI、真机遥操、人 类视频、仿真生成等,但它们各有限制: 机器人要完成灵巧操作的学习,必须要从训练数据中找到线索。这个线索可以是抓取的力量、目标物体 的纹理与颜色、每个指头的协调运动以及不断的视角切换。 机器人若要习得真正的"灵巧",必须从数据中寻得线索。 如果我们要求机器人像人一样思考,就必须先赋予 数据"人性"的颗粒度。 近期,灵初智能一套便携式外骨骼穿戴设备的出现,正试图打破僵局。拟人臂、触觉手套、同构外骨骼…… 这不仅是硬件的升级,更是将数采维 ...
老黄All in物理AI!最新GPU性能5倍提升,还砸掉了智驾门槛
具身智能之心· 2026-01-07 03:33
编辑丨 量子位 全力搞出来的结果也让围观群众直呼:竞争对手如何追上英伟达? 下一代Rubin架构GPU 推 理、训练性能分 别是 Blackwell GB 200的5倍和3.5倍 (NVFP4数据格式)。 刚刚,英伟达CEO黄仁勋穿着鳄鱼皮夹克,在全球最大消费电子展 CES 2026 上发布AI新品。 这是五年来,英伟达首次来到CES却没有发游戏显卡,态度很明确: 全力 搞AI。 点击下方 卡片 ,关注" 具身智能之心 "公众号 >> 点击进入→ 具身 智能之心 技术交流群 更多干货,欢迎加入国内首个具身智能全栈学习社区: 具身智能之心知识星球(戳我) ,这里包含所有你想要的! 除此之外,老黄还带来了五大领域的全新发布,包括: 同时,英伟达宣布持续向社区 开 源训 练框架 以 及 多模 态数据 集 。其中数据集包括10万亿语言训练token、50万条机器人轨迹数据、 45.5万个蛋白质结构、100TB车辆传感器数据。 这次的核心主题,直指 物理AI 。 面向Agentic AI的 NVIDIA Nemotron 模型家族 面向物理AI的 NVIDIA Cosmos 平台 面向自动驾驶开发的全新 NVIDIA ...
CycleVLA:让 VLAs 具备“预判初期失败、回溯重试恢复”的能力
具身智能之心· 2026-01-07 03:33
机器人执行任务时,失败往往难以挽回——比如抓取物体时姿势偏差导致物体掉落,或长序列任务中错误累积最终导致执行崩溃。传统方法大多采用"事后纠正"模 式:只有在失败发生后才分析错误并补救,而人类的纠错方式是"主动预判"——比如杯子刚要滑落时立刻握紧,车辆即将偏离车道时提前调整方向,在失败完全显 现前就介入修正。 这一差异揭示了现有视觉-语言-动作模型(VLAs)的关键局限:缺乏对子任务进度的感知能力,无法识别失败高发的子任务转换节点,且重试机制效率低下。为 此,CycleVLA 提出一套主动自纠正框架,核心目标是让 VLAs 具备"预判初期失败、回溯重试恢复"的能力,尤其针对长 horizon 任务和欠训练模型的性能短板。 二、核心设计:三大模块构建主动自纠正循环 点击下方 卡片 ,关注" 具身智能 之心 "公众号 作者丨 Chenyang Ma等 编辑丨具身智能之心 本文只做学术分享,如有侵权,联系删文 >> 点击进入→ 具身智能之心 技术交流群 更多干货,欢迎加入国内首个具身智能全栈学习社区 : 具身智能之心知识星球 (戳我) , 这里包含所有你想要的。 一、 CycleVLA的 核心背景与动机 CycleV ...
当我们把VLA+RL任务展开后......
具身智能之心· 2026-01-06 10:00
如果说今年哪个方向最受欢迎,一定是VLA+RL。 VLA模型为具身智能带来了新的交互范式:机器人不再依赖精确定义的状态和规则,而是通过视觉感知环 境、理解语言指令,并直接生成动作序列。这一能力极大地降低了任务描述和系统设计的门槛,使机器人 能够应对更加开放和复杂的场景。 然而,在真实机器人系统中,VLA 往往仍然面临执行不稳定、对初始状态敏感、长时序任务易失败等问 题,其核心原因在于模型缺乏基于环境反馈的持续修正能力。 强化学习的出现为VLA带来了新的解决思路。RL并不是一门新的学科,但RL的优势为VLA提供了从"理 解"走向"执行优化"的关键机制。通过引入奖励或价值信号,RL可以在保持VLA感知与语言能力的同时,对 动作策略进行闭环优化,弥补模仿学习在分布外状态和误差累积上的不足。 当前的研究趋势也逐渐从"单纯训练 VLA 模型"转向"以 VLA 作为策略表示,结合RL进行微调和强化",包 括离线 RL 提升样本效率、层级 RL 约束长时序行为,以及基于视觉和语言的自监督反馈建模等方向。 方法上,目前VLA+RL主要分为在线RL、离线RL、test-time三种方案。 paper多,想入坑的人也多了起来.. ...
打破机器人高门槛!1.98万双臂人形机器人,带你体验具身智能新革命!
具身智能之心· 2026-01-06 04:00
点击下方 卡片 ,关注" VLAI Robotics未来 动力 "公众号 如果你还在为高昂的机器人价格而犹豫不决,或者一直在忍受"无法协同、不够智能"的机器人痛点,今天VLAI Robotics给你带来了真正的突破——X系列双臂人形 机器人,价格仅售 1.98万元起! 产品级价格,科研级性能,让具身智能触手可得! 三大核心突破,重新定义双臂机器人! 超高灵活性,精准还原人类动作 :X系列"人尺度"为核心设计理念,单臂搭载 7 个基础运动自由度与 1 个夹爪控制自由度,总自由度达 8 DOF,双臂协同更是实现 16 DOF 全维度灵活操控,从肩部的自然舒展、肘部的精准弯折到腕部的灵活旋转,每一处动作都 完美还原人类上肢的自然运动轨迹 。基础版双臂可稳定承载 8kg 重物,Air 及以上版本直接将负载能力升级至 12kg ,在保持轻量化设计带来的灵活优势之余,更能精准完成各类 高精度抓取 、复杂操作任务,实用价值拉满! 仿生学技术,解决传统机器人僵硬问题 :X系列双臂机器人凭借前沿仿生运动学建模与高顺应性控制策略,实现了类人运动的自然复刻,能始终维持高精度控制, 为 远程操控、模仿学习与人机交互研究 提供核心基础 ...
正式开始学习!使用低成本机械臂复现pi0和pi0.5~
具身智能之心· 2026-01-06 00:32
点击下方 卡片 ,关注" 具身智能 之心 "公众号 编辑丨具身智能之心 本文只做学术分享,如有侵权,联系删文 >> 点击进入→ 具身智能之心 技术交流群 更多干货,欢迎加入国内首个具身智能全栈学习社区 : 具身智能之心知识星球 (戳我) , 这里包含所有你想要 的。 最近看到了很多HR的职位需求,list很长,但VLA算法是很"急需"。这一点,也体现在论文数量上。每天带着很多 小朋友看论文,也几乎都和VLA"挂钩"。 ❝ 但VLA貌似"很伤",不好调,数据采集麻烦。这个事情,是很多同学持续在吐槽的。 只看论文而没有真机实验,在仿真里面做了好久,也不知道动起来啥样子。确实,具身和其它领域都有所不同,太 注重本体,即使是算法也极其依赖硬件。 ❝ 不少同学说,相当多的时间"浪费"在踩坑上了。 确实,真实数据采集上,需要借助硬件完成,比如遥操、VR、全身动补等方式。仿真和互联网数据,在泛化性能上 依然得不到保证,很多具身公司坚持"真机数据"路线。但真机数据采的数据并不好用,该怎么办?一轮下来又需要 好久。 模型优化上也很难顶,有的效果就是调不出,或者说训练不出效果。有些算法就是没效果,不知道怎么分析,真机 上一塌糊涂 ...
Vbot Lab:有生命力的具身智能“行为基础大模型”
具身智能之心· 2026-01-06 00:32
>> 点击进入→ 具身 智能之心 技术交流群 更多干货,欢迎加入国内首个具身智能全栈学习社区: 具身智能之心知识星球(戳我) ,这里包含所有你想要的! 以下文章来源于具身纪元 ,作者Vbot算法团队 具身纪元 . 见证具身浪潮,书写智能新纪元 作者丨 Vbot算法团队 编辑丨 具身纪元 点击下方 卡片 ,关注" 具身智能之心 "公众号 现有的四足机器人为什么很难有生命力? 我们常见的机器狗,在用户面前展现的都是极限运动能力。 似乎缺少了那么一点点灵性。 其中一个原因是,传统的四足控制擅长单一任务的稳健执行,对多动作切换不友好。 主流做法是:一个动作一个策略——后空翻、跳高、作揖各自单独训练和调参,动作之间的自然衔接就是无人关注的角落了。 这样一来,在大家看这些动作时,就像是看一个个不太连贯的镜头剪辑。 而对于在真实环境里与人一起活动的场景(而不是观看机器人表演的场景)来说,用户更在意的是一起活动的连续性和稳定性,而不是某一个单项动作的极限指标。 单一动作模式让机器人具备了执行指令的功能,却失去了生物体应有的灵性,导致动作转换生硬,难以展现出连续、流畅且富有情感表达力的复杂行为。 打造一个有灵性的具身智能,才是 ...