Workflow
VLA+RL还是纯强化?从200多篇工作中看强化学习的发展路线
具身智能之心·2025-08-18 00:07

点击下方 卡片 ,关注" 具身智能 之心 "公众号 作者丨 Weijia Wu等 编辑丨具身智能之心 本文只做学术分享,如有侵权,联系删文 >> 点击进入→ 具身智能之心 技术交流群 更多干货,欢迎加入国内首个具身智能全栈学习社区 : 具身智能之心知识星球 (戳我) , 这里包含所有你想要的。 出发点与工作背景 近年来,强化学习(RL)与视觉智能交叉领域的进展催生了这样一类智能体:它们不仅能感知复杂的视觉场景,还能在其中进行推理、生成和行动。本篇综述 对视觉强化学习这一交叉领域进行了关键且最新的综合分析,先将该问题形式化并追溯相关策略优化策略的演变,再把 200 多篇代表性研究成果归纳为多模态大 型语言模型、视觉生成、统一模型框架和视觉 - 语言 - 动作模型四大主题支柱,考察各支柱的算法设计、奖励工程和基准进展并提炼趋势,最后回顾评估协议, 指 出 开 放 挑 战 , 旨 在 为 研 究 人 员 和 从 业 者 提 供 该 领 域 的 清 晰 地 图 并 强 调 未 来 有 前 景 的 研 究 方 向 。 相 关 资 源 可 在 以 下 网 址 获 取 : https://github.com/weijia ...