MCTD)

Search documents
图灵奖得主加持,蒙特卡洛树搜索×扩散模型杀回规划赛道|ICML 2025 Spotlight
量子位· 2025-08-01 04:23
henry 发自 凹非寺 量子位 | 公众号 QbitAI Make MCTS Great Again? 如何在 探索(Explore)未知可能性以寻找更优解和利用(Exploit)当前已知最佳方案之间取得平衡,一直是复杂决策和长程规划任务的核 心挑战之一。 一个过于强调探索的系统可能效率低下,在大量平庸选项中徘徊;而一个过于强调利用的系统则可能过早收敛到局部最优,错过全局最佳解。 一个不起眼的迷宫导航任务,却能让一众模型"原形毕露"。 Diffuser和Diffusion Forcing双双翻车,通关率低得可怜。 唯独有一个模型,通关率高达 100%。 而它就来自图灵奖得主Yoshua Bengio与其团队提出的全新方法: 蒙特卡洛树扩散(Monte Carlo Tree Diffusion, MCTD) 。 这个方法将" 上古时代 "的蒙特卡洛树搜索,和当下热门的扩散模型结合在一起,突破了扩散模型在长程任务推理阶段缺乏可扩展性的瓶颈, 并成功入选ICML 2025的Spotlight。 对于扩散模型来说,它虽然能够通过 去噪过程实现高质量、全局一致的序列生成(对数据分布的"利用"), 但缺乏在不确定性下主 ...