Workflow
喝点VC|红杉对话OpenAI Deep Research团队:AI Agent将成为今年最具突破性技术,强化学习重新回归主流
Z Potentials·2025-03-10 03:07

图片来源 : Sequoia Capital Z Highlights Training Data 是一档聚焦 AI 研究与创新的播客节目,由红杉资本( Sequoia Capital )的 Sonya Huang 和 Lauren Reeder 主持。本期节目邀请 OpenAI 的 Isa Fulford 和 Josh Tobin ,探讨最新智能体 Deep Research 如何通过端到端强化学习突破传统 AI 研究方法,并压缩数小时的知识工作至数分钟,从而革新 商业与个人应用场景。 深度研究的起源与技术创新 Josh : 在 AI 领域,人们屡次从实践中汲取经验。例如,最初我们认为通过自行编写代码,可以构建出比模型更智能的系统。然而,随着该领域的发展,事 实证明,模型往往能够提出比人类更优的解决方案。机器学习的一个基本原则是: " 优化的目标决定最终的结果。 " 因此, 如果能够构建一个系统,使其 能够直接优化目标结果,那么其表现通常会优于人为组合多个未针对特定任务进行端到端优化的模型 。因此,我的长期指导思想是,类似于强化学习的策 略,即在模型的基础上进行调整,可能是构建最强大 AI Agent 的关 ...