RL 圈的夏夜之约!12 人唠嗑局:当强化学习撞上大模型 Agent
机器之心·2025-07-08 04:09
活动档案速报 主题 :强化学习新范式探索之夜:从基础模型到 Agent 的进阶之路 嘿!RL 圈的潮玩咖看过来! 大模型时代卷起技术狂潮,强化学习(RL)早已不是 "小众玩家",当它牵手大模型智能体,直接开启「王 炸组合」模式!想不想潜入神秘据点,边嗨边聊最 in 的 RL 新范式?7 月 26 日晚, 由机器之心主办、东浩 兰生支持,作为 WAIC 官方活动之一的 「强化学习新范式探索之夜」 热力开启, 咱们组个「技术吐槽局」 +「脑洞开黑局」, 等你带「料」赴约~ 时间 :2025 年 7 月 26 日 19:00-21:10(白天逛完 WAIC 直接转场,不耽误你狂卷干货又能嗨聊技术~) 1.「强化学习 × 大模型智能体」:CP 组合如何原地封神? 2. 训练推理两难:探索新策略 VS 守稳基本盘,怎么选? 3. 对齐评估大考:如何让智能体 "听话又能打"? 已锁定的「技术搭子」阵容 ▪️吴翼 | 清华大学交叉信息研究院助理教授 (学术圈「理论脑洞王」本王) 地点 :上海世博展览馆附近 规模 :仅限 12 位,手慢无!主打一个 "小而精" 的深度贴脸交流,拒绝人海战术,每个人都能疯狂输出! 我们聊什么? ...