Workflow
从 OpenAI 回清华,吴翼揭秘强化学习之路:随机选的、笑谈“当年不懂股权的我” | AGI 技术 50 人
AI科技大本营·2025-06-19 01:41

受访者 | 吴翼 采访 | 王启隆 编辑 | 屠敏 出品 | CSDN(ID:CSDNnews) 人工智能的浪潮席卷而来,从大模型竞赛到智能体系统的探索,从生成模型到推理模型,技术巨头们 纷纷入场,推动着一场"AI 重新定义一切"的时代跃迁。但在这场热潮背后,真正推动技术向前的, 从来不是一场场轰动的发布会,也不是那些令人眼花缭乱的融资神话,而是一群敢于直面复杂性、埋 头钻研底层机制的工程师与研究者。 吴翼,就是其中一位。 1992 年出生的他,高中时期便在全国青少年信息学奥林匹克竞赛(NOI2009)中斩获金牌,并代 表中国参加国际信息学奥林匹克竞赛(IOI2010)。此后,他被清华大学交叉信息研究院提前"签 下",保送进入以"顶尖人才训练"著称的姚班,成为 图灵奖得主姚期智教授的桃李门生 。在本科阶 段,吴翼先后前往微软亚洲研究院、Facebook 实习,积累了丰富的经验。 2014 年本科毕业后,吴翼赴加州大学伯克利分校,攻读人工智能方向的博士学位,师从著名 AI 学 者 Stuart Russell,深入研究深度强化学习的泛化性以及多智能体学习。博士毕业后,他加入 OpenAI,成为全职研究员。 在 ...