Workflow
Cocos系统:让你的VLA模型实现了更快的收敛速度和更高的成功率
具身智能之心·2025-08-22 00:04

更多干货,欢迎加入国内首个具身智能全栈学习社区 : 具身智能之心知识星球 (戳我) , 这里包含所有你想要的。 写在前面 点击下方 卡片 ,关注" 具身智能 之心 "公众号 编辑丨具身智能之心 本文只做学术分享,如有侵权,联系删文 >> 点击进入→ 具身智能之心 技术交流群 具身智能目前已经成为人工智能研究的前沿领域。随着机器人技术的快速发展,如何让机器人更好地理解和执行复杂任务成为了一个重要的研究方向。扩散策略 (Diffusion Policy)发挥了扩散模型(Diffusion models)对复杂分布的拟合能力,成为了构建视觉-语言-动作(VLA)模型的主流范式。然而,现有的扩散策略 在训练效率上仍然存在不足。本文发现了扩散策略训练低效的一个关键挑战:当扩散模型神经网络难以区分生成条件——即视觉输入和语言指令时,训练目标会 发生退化,变成对边际动作分布的建模,该现象被称为损失崩塌(loss collapse)。为了解决损失崩塌的问题,可以简单地将动作生成的源分布(source distribution)修改为依赖于生成条件的分布( Co ndition- co nditioned s ource di ...