AI的下一步：强化学习是正确的AGI解法吗？｜硅谷101年度线下大会｜Alignment 2025

【硅谷101年度线下大会回放】2016年，AlphaGo击败围棋世界冠军，让强化学习一战成名。如今，从推荐算法到自动驾驶，强化学习已成为推动AI向AGI进化的第二引擎。然而，其效率低下与自身缺陷等问题，也遭到了包括OpenAI联合创始人Andrej Karpathy等专家们的质疑。今年的硅谷101 Alignment大会的强化学习专题论坛上，我们邀请到了来自OpenAI、亚马逊、前Meta以及LinkedIn的四位重量级嘉宾，围绕RLVR（基于可验证奖励的强化学习）、人类反馈数据的“黄金标准”、探索与抽象以及被称为“强化学习之父”的 “OaK” 架构等前沿议题，展开了一场极其坦诚、也极其硬核的讨论。他们眼中强化学习的极限在哪里？最终，AI能否凭借强化学习，走向真正的知识创新？硅谷101于2025年10月5日在硅谷线下举办的Alignment2025年度科技大会上，不少演讲嘉宾分享了极具价值的观点，我们将会把一些重要观点逐渐整理上线。我们的线下大会是全英文，嘉宾的分享将用中文字幕的方式呈现。圆桌嘉宾：朱哲清（主持人）：Pokee.ai创始人、前Meta AI应用强化学习负责人 Lihong Li：亚马逊 ...