AI的下一步:强化学习是正确的AGI解法吗?|硅谷101年度线下大会|Alignment 2025
硅谷101·2025-11-20 03:56
【硅谷101年度线下大会回放】2016年,AlphaGo击败围棋世界冠军,让强化学习一战成名。如今,从推荐算法到自动驾驶,强化学习已成为推动AI向AGI进化的第二引擎。然而,其效率低下与自身缺陷等问题,也遭到了包括OpenAI联合创始人Andrej Karpathy等专家们的质疑。 今年的硅谷101 Alignment大会的强化学习专题论坛上,我们邀请到了来自OpenAI、亚马逊、前Meta以及LinkedIn的四位重量级嘉宾,围绕RLVR(基于可验证奖励的强化学习)、人类反馈数据的“黄金标准”、探索与抽象以及被称为“强化学习之父”的 “OaK” 架构等前沿议题,展开了一场极其坦诚、也极其硬核的讨论。他们眼中强化学习的极限在哪里?最终,AI能否凭借强化学习,走向真正的知识创新? 硅谷101于2025年10月5日在硅谷线下举办的Alignment2025年度科技大会上,不少演讲嘉宾分享了极具价值的观点,我们将会把一些重要观点逐渐整理上线。我们的线下大会是全英文,嘉宾的分享将用中文字幕的方式呈现。 圆桌嘉宾: 朱哲清(主持人):Pokee.ai创始人、前Meta AI应用强化学习负责人 Lihong Li:亚马逊 ...