让机器人“舞得更好”的全身运控的方案还有哪些进化空间?
具身智能之心·2026-01-04 00:32
点击下方 卡片 ,关注" 具身智能 之心 "公众号 编辑丨具身智能之心 本文只做学术分享,如有侵权,联系删文 >> 点击进入→ 具身智能之心 技术交流群 更多干货,欢迎加入国内首个具身智能全栈学习社区 : 具身智能之心知识星球 (戳我) , 这里包含所有你想要的。 ★ 继续具身智能之心上次的圆桌,我们为大家整理了机器人全身运控的一些insigts。这次主要探索RL+VLA、realsim2real、3DGS和仿真的一些问题,近万字分 享。 刘斯坦: 我们想聊一聊关于RL的事情,现在很多VLA的训练已经有点类似于标准化了,先进行模仿学习训练基座。然后基于一些仿真环境进行一些强化学习,就是跑最后的 是一公里或者十公里,最后的10%好像已经有一些这种标准化的一种训练的方式。我们如果看 deepseek R1。还有比如说最近提出的那个超级人工智能的一些图景的 话,其实全部都是关于RL的训练范式有关的创新,就是RL它不是一个简单的就是一个强化学习上,然后仿真环境去用了就结束了。它可能是涉及到一个非常复杂 的流程等等,我们想在第二个大问题的第一个小问题的讨论是关于RL训练范式的创新和未来发展的情况。首先,我们想就是问问张 ...