Workflow
FAST(频域动作序列分词)动作编码技术
icon
Search documents
π0-FAST正式集成到LeRobot中!pytorch版本来了
具身智能之心· 2026-01-14 09:00
>> 点击进入→ 具身智能之心 技术交流群 点击下方 卡片 ,关注" 具身智能 之心 "公众号 编辑丨具身智能之心 本文只做学术分享,如有侵权,联系删文 目前LeRobot已经将π0、π0.5、π0-fast做了支持,除此之外国产模型WALL-OSS也被集成进去。 更多干货,欢迎加入国内首个具身智能全栈学习社区 : 具身智能之心知识星球 (戳我) , 这里包含所有你想要的。 π0-FAST通过信号处理方法压缩动作序列,生成可自回归预测的密集动作词元序列:其预测方式与语言词元完全一致,从而解决了这一难题。 原版pi0-FAST实现仅支持 JAX 框架,本次用PyTorch进行了重构,包含了交叉熵损失目标、FAST分词方案以及KV缓存等推理优化技术。 pi系列工作已基本支持 π0-FAST是pi团队新推出的,一款融合了视觉语言模型的能力与FAST(频域动作序列分词)动作编码技术的模型。该方案使自回归 VLA 模型能够训练高精度操作任 务,这是传统方法无法实现的。除此之外,训练速度相比π0等扩散模型方法提升高达5倍。 目前已经集成到LeRobot框架中。 为什么集成这个工作? 传统机器人动作编码方法通常采用简单的按 ...