Workflow
具身智能之心
icon
Search documents
Physical Intelligence团队正式发布π*0.6!VLA+强化学习训练达到实际可用的鲁棒性水平
具身智能之心· 2025-11-18 03:38
点击下方 卡片 ,关注" 具身智能 之心 "公众号 作者丨 Physical Intelligence团队 编辑丨具身智能之心 本文只做学术分享,如有侵权,联系删文 >> 点击进入→ 具身智能之心 技术交流群 更多干货,欢迎加入国内首个具身智能全栈学习社区 : 具身智能之心知识星球 (戳我) , 这里包含所有你想要的。 11月17号!Physical Intelligence团队正式发布 ,从经验中学习的VLA。 项目链接:https://www.pi.website/blog/pistar06 论文链接:https://www.pi.website/download/pistar06.pdf VLA模型如何通过强化学习在现实部署中实现自我改进? 提出了一种通用方法RECAP:基于经验与校正的优势条件策略强化学习,该方法通过优势条件机制 实现VLA模型的强化学习训练。 该方法将异构数据整合到自我改进过程中,包括演示数据、在线收集数据以及在自主执行期间专家远程干预数据。RECAP方法首先通过离线强化学习预训练通用型 VLA模型(记为 ),该模型随后可通过机器人现场数据收集实现下游任务的专业化性能提升。 实验表明 ...
开箱子,叠毛巾!从零把pi0部署到你的机械臂上吧!
具身智能之心· 2025-11-18 03:38
支持pi0部署了~ 最近刚把pi0任务打通,代码也会对客户正式开源,助力大家加速具身科研落地。感兴趣的同学可以关注下 ~ 面向具身科研领域打造的轻量级高性价比机械臂 还在为具身智能领域的硬件选择发愁吗? 太贵的机械臂买不起,太便宜的又难用、难上手? 别担心,Imeta-Y1 来了——这是一款专为新手和科研初学者设计的轻量级高性价比机械臂。 无论你是学生、教育工作者,还是刚踏入机器人领域的开发者,Imeta-Y1 都能帮你低成本、高效率地完成 算法验证与项目开发。 对小白尤其友好的是: ✅ 提供全流程开源工具链+代码示例,从数据采集到模型部署一气呵成; ✅ 支持 Python / C++ 双语言接口,无论你擅长哪种语言都能快速上手; ✅ 兼容 ROS1 / ROS2,并提供 URDF 模型,仿真与真机无缝切换; ✅ 24小时快速售后响应,遇到问题不卡壳,学习路上有保障! 该机械臂融合高精度运动控制、低功耗设计与开放软硬件架构,支持从仿真到真机的无缝联调,并提供全 流程开源SDK与工具链,助力用户快速实现算法验证、数据采集、模型训练与部署应用。 | 重量 | 631g | | --- | --- | | 尺寸 | ...
大多数开始具身研究的同学卡在了这些地方.......
具身智能之心· 2025-11-18 03:38
但还有相当多的同学卡住了,比如算力的问题,数据采集的问题,还有模型优化、项目实战的问题等。关于算 力,前面分享过很多轻量化的方法,也能做出不错的性能,甚至SOTA,这能够适配一些算力不足的同学。 近期开了一个小范围的线上会,和大家唠了一会儿近期的状态。一些同学能抓到关键的部分,跟着社区里面的 路线进步较快。即使用低成本的硬件方案,也能做出不错的效果,有的同学甚至已经把act和pi0部署上去了。 数据采集部分,建议大家先从基础的遥操作尝试,重点关注数据的质量,噪声数据,可能导致模型训不出效 果,特别是大多数数据都是噪声数据。数据量不够,可以尝试real2sim2real系列方法。 模型优化部分,对一些使用机械臂的同学,可以尝试RL+VLA方案,但人形和自由度多的本体,建议不要轻易 入坑,效果难做出。关于一些好的开源项目,已经汇总到社区内部,大家可以照着教程复现。 以上为我们的具身社区: 具身智能之心知识星球 的分享,也欢迎更多需要入门进阶的同学加入我们的社区。 近一年的搭建,社区内已经完成了技术路线分享、直播、问答、求职、赛事等多个版块的分享。实现了产业、 学术、求职、问答交流等多个领域的闭环。社区致力于为行业 ...
人形机器人赛道,早已挤满车企
具身智能之心· 2025-11-18 00:46
更多干货,欢迎加入国内首个具身智能全栈学习社区: 具身智能之心知识星球(戳我) ,这里包含所有你想要的! 一场由车企深度参与的机器人竞赛已拉开帷幕。 编辑丨具身智能之心 原文链接 | https://zhuanlan.zhihu.com/p/1973067340615817110 点击下方 卡片 ,关注" 具身智能之心 "公众号 >> 点击进入→ 具身 智能之心 技术交流群 据不完全统计,当前已有广汽、上汽、比亚迪、长安、奇瑞等十余家车企相继涌入人形机器人赛道。在海外,特斯拉、宝马等也提出了自己的人形机器人思路。 汽车产业链上游同样动作密集——2025年以来,A股近30家汽车零部件公司设立机器人子公司,瞄准灵巧手、传感器等关键环节。 业内认为,车企集体杀入机器人赛道,既是产业升级与技术演进的必然结果,也是新能源资本故事退潮后市场亟需的新估值锚点。在这场车企、科技巨头与初创 公司混战的新局中,胜负的关键已不在于某一单项技术的突破,而是跨系统整合能力与资本耐力的综合较量。 车企忙"造人" 一场由车企深度参与的机器人竞赛已拉开帷幕。 在11月7日的特斯拉年度股东大会上,马斯克称特斯拉人形机器人Optimus将是"史 ...
CMU团队等!机器人记忆新架构:物体中心状态建模,实现长时序操作!
具身智能之心· 2025-11-18 00:46
点击下方 卡片 ,关注" 具身智能 之心 "公众号 作者丨 Nhat Chung等 编辑丨具身智能之心 本文只做学术分享,如有侵权,联系删文 >> 点击进入→ 具身智能之心 技术交流群 更多干货,欢迎加入国内首个具身智能全栈学习社区 : 具身智能之心知识星球 (戳我) , 这里包含所有你想要的。 针对机器人在非马尔可夫场景下缺乏对象级记忆的问题,阿肯色大学联合卡内基梅隆大学等研究团队提出LIBERO-Mem基准套件与Embodied-SlotSSM模型,通过 结构化对象记忆与时间序列建模,实现长时程、部分可观测环境下的稳健操作决策。 核心贡献 LIBERO-Mem基准:非马尔可夫机器人操作评估 设计目标 聚焦对象级部分可观测-非马尔可夫场景,通过引入对象身份、位置、关系历史的模糊性,强制模型依赖时间推理而非仅当前视觉信息。 核心特征 任务类型:包含四类任务(figure 1),覆盖不同记忆维度 现实机器人操作场景中,任务成功依赖对象交互历史(如"是否已操作过某个物体""物体之前的位置"),而非仅当前观测。 现有视觉-语言-动作模型多遵循马尔可夫假设,仅依赖即时感官输入,缺乏对象级记忆机制,在重复操作、视觉相似 ...
离了大谱,21%的ICLR 2026审稿意见竟是AI生成的?官方回应来了
具身智能之心· 2025-11-18 00:46
编辑丨 机器之心 点击下方 卡片 ,关注" 具身智能之心 "公众号 >> 点击进入→ 具身 智能之心 技术交流群 更多干货,欢迎加入国内首个具身智能全栈学习社区: 具身智能之心知识星球(戳我) ,这里包含所有你想要的! 刚过去的这个周末,围绕 ICLR 2026 审稿意见中很多被标记为完全由 AI 生成的说法,引发了社区热烈讨论。本届会议将于 2026 年 4 月 23 日至 27 日在巴西里约 热内卢举行。 随着首轮分数的公布,有第三方机构开始对 ICLR 2026 的审稿意见进行系统性统计,其中发现了大量 AI 审稿的现象。 在对 75800 篇论文的审稿意见统计中,竟然 有 21% 完全由 AI 生成 、4% 重度由 AI 编辑、9% 中度由 AI 编辑、22% 轻度由 AI 编辑, 完全由人类(审稿人)撰 写的仅占 43% 。 图源: X@ Graham Neubig 并且还呈现出一些趋势,包括 AI 审稿意见篇幅更长、AI 审稿更可能给出高分 。 这项统计是由 潘格拉姆实验室(Pangram Labs) 完成的,这是一家专门检测 AI 生成(自动撰写或由大语言模型生成文字内容)的科技公司。此次,该机 ...
3DV 2026最新 | GaussianArt:清华智源通过高斯模型解决机器人操作仿真中关键问题
具身智能之心· 2025-11-17 10:01
点击下方 卡片 ,关注" 具身智能 之心 "公众号 作者丨 Licheng Shen等 编辑丨具身智能之心 本文只做学术分享,如有侵权,联系删文 >> 点击进入→ 具身智能之心 技术交流群 更多干货,欢迎加入国内首个具身智能全栈学习社区 : 具身智能之心知识星球 (戳我) , 这里包含所有你想要的。 导读 模拟铰链物体是计算机视觉与机器人操作仿真中的重要问题。现有方法通常采用两阶段流程——先建模物体不同状态,再推断关节运动——这不仅复杂化工作流 程,还限制了可扩展性。我们提出GaussianArt单阶段训练框架,通过关节式3D高斯模型统一运动与外观建模。本方法支持最多20个部件的复杂物体,并集成鲁 棒部件分割模块以精确分解关节级运动。相较于仅在19个物体上评估的先前的研究,我们通过90个铰接物体进行了大规模扩展评估,涵盖广泛的运动组合与几何 形态。GaussianArt在几何建模、视觉重建和运动估计方面均达到当前最佳水平,并能支持操作仿真等下游应用。本工作于近期被三维计算机视觉领域的垂类学 术会议3DV 2026正式接收。 论文链接 : https://arxiv.org/abs/2508.14891 代码仓 ...
具身智能之心招募VLA+RL方向的合作伙伴~
具身智能之心· 2025-11-17 10:01
需是VLA+RL的研究方向,学术界我们希望是博士及以上(包含在读),手握相关方向的顶会。工业界希 望您有一定的实战经验和真机调试经验。 待遇说明 具身智能之心是国内首个具身全栈技术交流社区,聚集了大量VLA和RL相关方向的同学。 最近收到社区内很多同学关于VLA和RL相关内容的咨询,也希望具身智能之心能够有更深入的讲解。在 此,我们向全平台粉丝招募1名VLA+RL方向的课程讲师,和我们一起开发这个方向的在线课程。 我们将提供高于行业平均水平的薪酬以及丰富的行业资源。 一些要求 详细内容欢迎添加微信:oooops-life咨询。 ...
具身界影响力最大的两位博士创业了!
具身智能之心· 2025-11-17 04:00
Core Insights - The article highlights the entrepreneurial ventures of two influential figures in the field of embodied intelligence, Tony Z. Zhao and Cheng Chi, who have recently co-founded a company named Sunday Robotics [2][4]. Group 1: Key Individuals - Tony Z. Zhao is a dropout PhD student from Stanford University, known for his contributions to ALOHA, ALOHA2, and Mobile ALOHA during his academic tenure [4][5]. - Cheng Chi, a PhD from Columbia University and a student of Shuran Song at Stanford, is recognized for his work on Universal Manipulation Interface (UMI) and Diffusion Policy, the latter being a finalist for Best Systems Paper at RSS 2024 [10]. Group 2: Company Overview - Sunday Robotics is the new venture launched by Tony Z. Zhao and Cheng Chi, indicating a significant step in the development of embodied intelligence technologies [2].
登上Science Robotic!一天学习1000个任务,内燃机的风还是吹到了机器人
具身智能之心· 2025-11-17 00:47
点击下方 卡片 ,关注" 具身智能 之心 "公众号 作者丨编辑丨具身智能之心 本文只做学术分享,如有侵权,联系删文 >> 点击进入→ 具身智能之心 技术交流群 更多干货,欢迎加入国内首个具身智能全栈学习社区 : 具身智能之心知识星球 (戳我) , 这里包含所有你想要的。 在机器人操作领域,"高效学习" 始终是核心难题——现有模仿学习方法往往需要数百甚至数千次演示才能掌握单个任务,规模化扩展到千种日常任务更是需要 海量数据与资源。而由帝国理工学院机器人学习实验室提出的 Multi-Task Trajectory Transfer(MT3) ,用 "轨迹分解为对齐 - 交互两阶段 + 检索式泛化" 的创 新思路,打破了这一困局:仅需单条演示即可教会机器人完成单个任务,在不到 24 小时的人类演示时间内,成功掌握 1000 种不同的日常操作任务,同时还能泛 化到全新物体实例,彻底革新了机器人模仿学习的效率天花板。 对齐阶段:解决 "去哪里操作" 的定位问题 为什么要重构机器人模仿学习的范式? 当前主流的机器人模仿学习方案陷入了 "数据效率困境":要么依赖单阶段整体策略,学习过程复杂且数据需求大;要么泛化能力弱,无法 ...