Workflow
OpenAI科学家姚顺雨:o3发布、RL迎来新范式,AI正式进入下半场
Founder Park·2025-04-17 12:12

有评论称这篇文章是 「 Bitter Lesson」级别的存在,或许是因为和 「 Bitter Lesson」类似,这篇文章也试图从 high level 指出 AI 研究中一种思维范 式的彻底改变。 「 Bitter Lesson 」启发了大家从 「 人类指导 AI」转向算力和数据的 scaling,而 The Second Half 告诉大家 在 RL 全面到来时,我 们应该彻底重新思考问题定义和真实用例的 evaluation。 姚顺雨本科毕业于清华姚班,是姚班联席会主席,2024 年从 Princeton 博士毕业后加入 OpenAI 担任 Research Scientist,参与了 OpenAI 的 Computer-Using Agent,Deep Research 等多个产品项目。他是 Agent 领域的最前沿探索者,这个领域不少最重要的 framework 和 benchmark 都来自 他 Phd 期间的工作:ReAct、Tree of Thought、SWE_Bench。 这篇博客主要内容来自姚顺雨在 CS 224N 和 Columbia 大学所做的演讲。 Founder Park 正在 ...