自监督强化学习
Search documents
宇树机器人春晚视频海外引热议!网友:不敢相信我的眼睛,震撼
Xin Lang Cai Jing· 2026-02-17 02:08
新浪科技讯 2月17日上午消息,新浪科技获悉,春晚期间登上舞台进行表演的宇树科技人形机器人在海 外再次掀起讨论热潮,由宇树科技Unitree官方发布的相关视频在不到 10 小时内播放量已近10万,众多 海外网友在评论区指出相关表演令人震惊。 值得一提的是,不少海外硬核技术爱好者对 2026 春晚宇树机器人(Unitree G1/H2)表演给出了极高的 技术评价。 海外网友指出:很多技术流在分析那个机器人"倒退跑酷"和"醉拳跌跌撞撞"的动作。他们认为宇树可能 实现了更高阶的自监督强化学习(Self-supervised Reinforcement Learning)。 硬核原话:"这不只是预设路径,你看它在做托马斯全旋(Thomas Flair)时,腿部的微调补偿快得惊 人。这说明它的平衡算法已经能实时处理极其复杂的非线性动态力矩。" 还有网友对机器人能完成"鲤鱼打挺(Kip-up)"感到极度震惊。这要求关节电机在瞬间爆发出极大的功 率。有网友指出,宇树可能在 G1 身上使用了新一代的集成减速器技术,使得推重比(Power-to-Weight ratio)达到了民用机器人的一个新巅峰。"要在这么细的腿部空间塞进 ...
北大新作EvoVLA:大幅降低机器人幻觉,长序列成功率暴涨10%
具身智能之心· 2025-11-30 03:03
编辑丨 新智元 点击下方 卡片 ,关注" 具身智能之心 "公众号 >> 点击进入→ 具身 智能之心 技术交流群 更多干货,欢迎加入国内首个具身智能全栈学习社区: 具身智能之心知识星球(戳我) ,这里包含所有你想要的! 【导读】 具身智能的「ChatGPT时刻」还没到,机器人的「幻觉」却先来了?在需要几十步操作的长序列任务中,现有的VLA模型经常「假装在干 活」,误以为任务完成。针对这一痛点,北京大学团队提出自进化VLA框架EvoVLA。该模型利用Gemini生成「硬负样本」进行对比学习,配合几 何探索与长程记忆,在复杂任务基准Discoverse-L上将成功率提升了10.2%,并将幻觉率从38.5%大幅降至14.8%。 具身智能(Embodied AI)正处于爆发前夜。 从谷歌的 RT-X 到开源社区的 OpenVLA,通才机器人策略(Generalist Robot Policies)展现出了惊人的零样本泛化能力。然而,当我们将目光从简单 的「抓取-放置」转向需要数十个步骤的长程操作任务(Long-horizon Manipulation)时,现有的 VLA 模型却暴露出一个尴尬的致命弱点: 它们学会了「作 ...