SIHD框架

Search documents
北航团队提出新的离线分层扩散框架:基于结构信息原理,实现稳定离线策略学习|NeurIPS 2025
AI前线· 2025-10-09 04:48
作者 | 北航彭浩团队 基于扩散模型(Diffusion Model)的生成方法已显示出用于从离线强化学习 (offline Reinforcement Learning) 数据集建模轨迹的巨大潜力,并且已引入 分层扩散(Hierarchical Diffusion)来减轻长期规划任务中的方差累积和计算挑战。然而,现有方法通常假设具有单个预定义时间尺度的固定两层扩散层 次结构,这限制了对各种下游任务的适应性并降低了决策的灵活性。 论文标题: Structural Information-based Hierarchical Diffusion for Offline Reinforcement Learning arxiv 地址: https://arxiv.org/abs/2509.21942 代码地址: https://github.com/SELGroup/SIHD 研究背景与动机 离线强化学习旨在解决一个核心挑战:如何在不与环境进行新交互的情况下,仅利用固定的历史数据集训练出有效的策略。扩散模型通过将策略学习重 构为条件轨迹生成任务,有效缓解了分布外(OOD)状态和动作导致的"外推误差"(extrap ...