具身智能之心 - filings, earnings calls, financial reports, news - Reportify

具身智能之心

Search documents

当我们把VLA+RL任务展开后......

具身智能之心· 2026-01-06 10:00

如果说今年哪个方向最受欢迎，一定是VLA+RL。 VLA模型为具身智能带来了新的交互范式：机器人不再依赖精确定义的状态和规则，而是通过视觉感知环境、理解语言指令，并直接生成动作序列。这一能力极大地降低了任务描述和系统设计的门槛，使机器人能够应对更加开放和复杂的场景。然而，在真实机器人系统中，VLA 往往仍然面临执行不稳定、对初始状态敏感、长时序任务易失败等问题，其核心原因在于模型缺乏基于环境反馈的持续修正能力。强化学习的出现为VLA带来了新的解决思路。RL并不是一门新的学科，但RL的优势为VLA提供了从"理解"走向"执行优化"的关键机制。通过引入奖励或价值信号，RL可以在保持VLA感知与语言能力的同时，对动作策略进行闭环优化，弥补模仿学习在分布外状态和误差累积上的不足。当前的研究趋势也逐渐从"单纯训练 VLA 模型"转向"以 VLA 作为策略表示，结合RL进行微调和强化"，包括离线 RL 提升样本效率、层级 RL 约束长时序行为，以及基于视觉和语言的自监督反馈建模等方向。方法上，目前VLA+RL主要分为在线RL、离线RL、test-time三种方案。 paper多，想入坑的人也多了起来.. ...

面向VLA+RL方向的科研辅导小课

面向VLA+RL方向的科研辅导小课

打破机器人高门槛！1.98万双臂人形机器人，带你体验具身智能新革命！

具身智能之心· 2026-01-06 04:00

点击下方卡片，关注" VLAI Robotics未来动力 "公众号如果你还在为高昂的机器人价格而犹豫不决，或者一直在忍受"无法协同、不够智能"的机器人痛点，今天VLAI Robotics给你带来了真正的突破——X系列双臂人形机器人，价格仅售 1.98万元起！产品级价格，科研级性能，让具身智能触手可得！三大核心突破，重新定义双臂机器人！超高灵活性，精准还原人类动作：X系列"人尺度"为核心设计理念，单臂搭载 7 个基础运动自由度与 1 个夹爪控制自由度，总自由度达 8 DOF，双臂协同更是实现 16 DOF 全维度灵活操控，从肩部的自然舒展、肘部的精准弯折到腕部的灵活旋转，每一处动作都完美还原人类上肢的自然运动轨迹。基础版双臂可稳定承载 8kg 重物，Air 及以上版本直接将负载能力升级至 12kg ，在保持轻量化设计带来的灵活优势之余，更能精准完成各类高精度抓取、复杂操作任务，实用价值拉满！仿生学技术，解决传统机器人僵硬问题：X系列双臂机器人凭借前沿仿生运动学建模与高顺应性控制策略，实现了类人运动的自然复刻，能始终维持高精度控制，为远程操控、模仿学习与人机交互研究提供核心基础 ...

VLAI-X系列双臂人形机器人

VLAI-X系列双臂人形机器人

正式开始学习！使用低成本机械臂复现pi0和pi0.5～

具身智能之心· 2026-01-06 00:32

点击下方卡片，关注" 具身智能之心 "公众号编辑丨具身智能之心本文只做学术分享，如有侵权，联系删文 >> 点击进入→ 具身智能之心技术交流群更多干货，欢迎加入国内首个具身智能全栈学习社区：具身智能之心知识星球 (戳我) ，这里包含所有你想要的。最近看到了很多HR的职位需求，list很长，但VLA算法是很"急需"。这一点，也体现在论文数量上。每天带着很多小朋友看论文，也几乎都和VLA"挂钩"。 ❝ 但VLA貌似"很伤"，不好调，数据采集麻烦。这个事情，是很多同学持续在吐槽的。只看论文而没有真机实验，在仿真里面做了好久，也不知道动起来啥样子。确实，具身和其它领域都有所不同，太注重本体，即使是算法也极其依赖硬件。 ❝ 不少同学说，相当多的时间"浪费"在踩坑上了。确实，真实数据采集上，需要借助硬件完成，比如遥操、VR、全身动补等方式。仿真和互联网数据，在泛化性能上依然得不到保证，很多具身公司坚持"真机数据"路线。但真机数据采的数据并不好用，该怎么办？一轮下来又需要好久。模型优化上也很难顶，有的效果就是调不出，或者说训练不出效果。有些算法就是没效果，不知道怎么分析，真机上一塌糊涂 ...

《面向实战与求职的VLA小班课》

SO-100机械臂

LeRobot训练平台

《面向实战与求职的VLA小班课》

SO-100机械臂

LeRobot训练平台

Vbot Lab：有生命力的具身智能“行为基础大模型”

具身智能之心· 2026-01-06 00:32

>> 点击进入→ 具身智能之心技术交流群更多干货，欢迎加入国内首个具身智能全栈学习社区：具身智能之心知识星球（戳我），这里包含所有你想要的! 以下文章来源于具身纪元，作者Vbot算法团队具身纪元 . 见证具身浪潮，书写智能新纪元作者丨 Vbot算法团队编辑丨具身纪元点击下方卡片，关注" 具身智能之心 "公众号现有的四足机器人为什么很难有生命力？我们常见的机器狗，在用户面前展现的都是极限运动能力。似乎缺少了那么一点点灵性。其中一个原因是，传统的四足控制擅长单一任务的稳健执行，对多动作切换不友好。主流做法是：一个动作一个策略——后空翻、跳高、作揖各自单独训练和调参，动作之间的自然衔接就是无人关注的角落了。这样一来，在大家看这些动作时，就像是看一个个不太连贯的镜头剪辑。而对于在真实环境里与人一起活动的场景（而不是观看机器人表演的场景）来说，用户更在意的是一起活动的连续性和稳定性，而不是某一个单项动作的极限指标。单一动作模式让机器人具备了执行指令的功能，却失去了生物体应有的灵性，导致动作转换生硬，难以展现出连续、流畅且富有情感表达力的复杂行为。打造一个有灵性的具身智能，才是 ...

零样本泛化

生成式编舞

四足机器人

四足行为基础模型

零样本泛化

生成式编舞

四足机器人

四足行为基础模型

空间智能终极挑战MMSI-Video-Bench来了

具身智能之心· 2026-01-06 00:32

编辑丨机器之心点击下方卡片，关注" 具身智能之心 "公众号 >> 点击进入→ 具身智能之心技术交流群更多干货，欢迎加入国内首个具身智能全栈学习社区：具身智能之心知识星球（戳我），这里包含所有你想要的! 空间理解能力是多模态大语言模型（MLLMs）走向真实物理世界，成为 "通用型智能助手" 的关键基础。但现有的空间智能评测基准往往有两类问题：一类高度依赖模板生成，限制了问题的多样性；另一类仅聚焦于某一种空间任务与受限场景，因此很难全面检验模型在真实世界中对空间的理解与推理能力。要真正走入现实世界，模型不仅需要看得见，更要看得懂空间：它需要在复杂、多变的真实场景中理解空间布局、感知运动变化、进行时空推理，并基于这些信息做出合理决策，与环境产生有效交互。为此，上海人工智能实验室 Inter nRobotics 团队近日推出了一套全面而硬核的空间智能视频基准 —— MMSI-Video-Bench ，对当前主流多模态大模型精心打造了一场挑战系数极高的 "空间智能大考"。本工作由上海人工智能实验室、上海交通大学、香港中文大学、浙江大学、香港大学、北京航空航天大学、西安交通大学、 ...

多模态大语言模型

Artificial Intelligence

MMSI-Video-Bench

多模态大语言模型

Artificial Intelligence

MMSI-Video-Bench

一个近300篇工作的综述！从“高层规划和低层控制”来看Manipulation任务的发展

具身智能之心· 2026-01-06 00:32

点击下方卡片，关注" 具身智能之心 "公众号编辑丨具身智能之心本文只做学术分享，如有侵权，联系删文 >> 点击进入→ 具身智能之心技术交流群更多干货，欢迎加入国内首个具身智能全栈学习社区：具身智能之心知识星球 (戳我) ，这里包含所有你想要的。在具身智能领域，机器人操纵作为核心难题，随着视觉、语言及多模态学习的飞速发展迎来变革。大型基础模型的出现，大幅提升了机器人的感知与语义表征能力，使其能在非结构化环境中基于自然语言指令完成任务。由西安交通大学、香港科技大学（广州）等多所高校联合撰写的综述，以 "高层规划 + 低层控制" 的统一框架，系统梳理了基于学习的机器人操纵方法，明确了当前技术瓶颈与未来方向，为该领域的研究提供了全面且结构化的参考。论文名称：Embodied Robot Manipulation in the Era of Foundation Models: Planning and Learning Perspectives 论文链接：https://arxiv.org/pdf/2512.22983 项目链接：https://github.com/BaiShuangha ...

机器人操纵

机器人操纵

多家具身公司正在推进IPO......

具身智能之心· 2026-01-05 09:28

2025年11月15日，宇树科技IPO上市辅导工作完成，公告显示，宇树科技拟申请在境内IPO。中国证监会官网的这一信息。 2）银河通用 2025年12月，多个媒体报道银河通用完成股改，开始筹赴港上市。最近社区分享了几家正在IPO进程的公司，都在大考，还有许多公司正在排队准备了。这里为大家整理了下相关内容，本次整理参考各类已经公开的内容，若有不足欢迎后台指正。 1）宇树科技 3）智元机器人智元机器人于2025年3月完成股改，11月宣布拟赴港IPO。 2025年7月通过其持股平台计划收购科创板上市公司上纬新材63.62%的股份，被市场解读为"借壳上市"的关键落子。尽管智元对外回应称"本次行动仅为收购控股权，不构成《重大资产重组办法》所定义的借壳上市"，但这一动作被业界视为加速上市进程的重要举措。 4）乐聚机器人 1）持续的直播分享社区为大家准备了很多圆桌论坛、直播，从本体、数据到算法，各类各样，逐步为大家分享具身行业究竟在发生什么？还有哪些问题待解决。 2025年10月30日，乐聚智能（深圳）股份有限公司在深圳证监局完成上市辅导备案登记，辅导券商为东方证券。 5）云深处 2025年12月23日， ...

网传某头部具身公司上市“绿色通道”被叫停，当事人正式回应......

具身智能之心· 2026-01-05 03:30

点击下方卡片，关注" 具身智能之心 "公众号转载丨澎湃新闻本文只做学术分享，如有侵权，联系删文宇树科技于2025年7月8日提交了辅导备案登记材料，由中信证券担任辅导机构； >> 点击进入→ 具身智能之心技术交流群更多干货，欢迎加入国内首个具身智能全栈学习社区：具身智能之心知识星球 (戳我) ，这里包含所有你想要的。近日，某媒体发布宇树科技上市相关报道，涉及"所谓绿色通道被叫停"，并被众多媒体、网络平台及自媒体大规模转载。昨日，宇树科技正式向相关新闻媒体回应。该报道涉及我司上市工作相关动态情况的内容与事实情况不符，我司未涉及申请"绿色通道"相关事宜。相关报道误导公众认知，已严重侵害我司合法权益。我司已向主管部门反映，同时督促相关方撤回不实报道。我司在此严正声明，后续将保留通过法律手段追责的权利。宇树科技表示，目前，公司上市工作正常推进，相关进展将依法依规进行披露，感谢社会各界对公司的关心与支持。 4日早些时候，有报道称，宇树科技A股上市的绿色通道被叫停，但常规上市流程仍继续，被叫停或是因为"目前机器人赛道泡沫太大了"，管理层希望能降降温。随后，一张疑似宇树科技创始人、董事长王兴兴 ...

人形机器人

四足机器人

人形机器人

四足机器人

全职/兼职/实习！具身智能之心招募运营、编辑和销售的同学了

具身智能之心· 2026-01-05 03:30

负责公众号、小红书、社群的运营，提升粉丝粘性和关注度。我们希望您有一定的运营能力，对自媒体平台的玩法有一定认识。咨询我们负责日常公众号平台的内容创作、编辑，我们希望您具备一定的专业基础，在知乎、公众号等平台上具有内容创作经验。销售岗位负责平台课程、硬件等产品的销售推广。我们希望您具备一定的销售基础，对具身用户需求与市场有一定的了解。运营岗位具身智能之心是具身领域的优秀技术创作平台，为行业输出了大量的前沿技术、课程、行业概况、融资、产品、政策等内容。现平台正处于上升期，因业务需求，面向全体粉丝招募编辑、运营、销售岗位，和我们一起继续为领域创造价值，全职+实习哦（实习除编辑岗位均需线下哦～）编辑岗位如果您有兴趣和我们一起成长，欢迎添加峰哥微信oooops-life ...

王鹤团队最新！解决VLA 模型缺乏精准几何信息的问题

具身智能之心· 2026-01-05 01:03

点击下方卡片，关注" 具身智能之心 "公众号编辑丨具身智能之心本文只做学术分享，如有侵权，联系删文 >> 点击进入→ 具身智能之心技术交流群更多干货，欢迎加入国内首个具身智能全栈学习社区：具身智能之心知识星球 (戳我) ，这里包含所有你想要的。在机器人操作领域，VLA模型通过端到端框架将视觉输入与语言指令映射为动作，实现了多样化技能学习。然而，现有 VLA 模型多依赖单视角 RGB 图像，缺乏精准空间几何信息，难以满足高精度操纵需求。由 Galbot、北京大学、香港大学等团队联合提出的 StereoVLA 模型，创新性地融合立体视觉的丰富几何线索，通过 "几何 - 语义特征提取 - 交互区域深度估计 - 多场景验证" 的技术体系，首次系统性解决了 VLA 模型空间感知不足的核心问题，为机器人精准操纵提供了全新解决方案。论文题目：StereoVLA: Enhancing Vision-Language-Action Models with Stereo Vision 项目链接：https://shengliangd.github.io/StereoVLA-Webpage 问题根源 ...

视觉语言动作模型（VLA）

StereoVLA模型

视觉语言动作模型（VLA）

StereoVLA模型