让机器人“舞得更好”的全身运控的方案还有哪些进化空间？

点击下方卡片，关注" 具身智能之心 "公众号编辑丨具身智能之心本文只做学术分享，如有侵权，联系删文 >> 点击进入→ 具身智能之心技术交流群更多干货，欢迎加入国内首个具身智能全栈学习社区：具身智能之心知识星球 (戳我) ，这里包含所有你想要的。 ★ 继续具身智能之心上次的圆桌，我们为大家整理了机器人全身运控的一些insigts。这次主要探索RL+VLA、realsim2real、3DGS和仿真的一些问题，近万字分享。刘斯坦：我们想聊一聊关于RL的事情，现在很多VLA的训练已经有点类似于标准化了，先进行模仿学习训练基座。然后基于一些仿真环境进行一些强化学习，就是跑最后的是一公里或者十公里，最后的10%好像已经有一些这种标准化的一种训练的方式。我们如果看 deepseek R1。还有比如说最近提出的那个超级人工智能的一些图景的话，其实全部都是关于RL的训练范式有关的创新，就是RL它不是一个简单的就是一个强化学习上，然后仿真环境去用了就结束了。它可能是涉及到一个非常复杂的流程等等，我们想在第二个大问题的第一个小问题的讨论是关于RL训练范式的创新和未来发展的情况。首先，我们想就是问问张 ...