RLinf开源!首个面向具身智能“渲训推一体化”的大规模强化学习框架
具身智能之心·2025-09-01 04:02
点击下方 卡片 ,关注" 具身智能 之心 "公众号 导语: 清华大学、北京中关村学院、无问芯穹联合北大、伯克利等机构重磅开源RLinf:首个面向具身智能的"渲训 推一体化"大规模强化学习框架。 代码链接 :https://github.com/RLinf/RLinf Hugging Face链接 :https://huggingface.co/RLinf 使用文档链接 :https://rlinf.readthedocs.io/en/latest/ 人工智能正在经历从"感知"到"行动"的跨越式发展,融合大模型的具身智能被认为是人工智能的下一发展阶段,成 为学术界与工业界共同关注的话题。在大模型领域,随着o1/R1系列推理模型的发布,模型训练的重心逐渐从数据 驱动的预训练/后训练转向奖励驱动的强化学习(Reinforcement Learning, RL)。OpenAI预测强化学习所需要的算 力甚至将超过预训练。与此同时,能够将大规模算力高效利用的RL infra的重要性也日益凸显,近期也涌现出一批 优秀的框架,极大地促进了该领域的发展。 然而,当前框架对具身智能的支持仍然受限。相比推理大模型这一类纯大脑模型, ...