PufferLib - filings, earnings calls, financial reports, news - Reportify

PufferLib

Search documents

LLM抢人血案：强化学习天才被挖空，一朝沦为「无人区」

3 6 Ke· 2025-08-04 07:22

最近，斯坦福的AI+CS博士Joseph Suarez发表了对强化学习的历史回顾。结果，在上火了！目前，已有38.2万阅读。封面可谓醒目：一条曲线线先是快速上升，然后平缓爬升，最后却急转直下，暗喻RL领域的研究前途不妙！从历史角度看，强化学习发生了什么？为什么到现在它才真正开始起飞？他提供了独特的个人视角。师出名门 2019年，他本科毕业于斯坦福大学计算机科学专业人工智能方向。 2018年，他利用休学期在OpenAI完成6个月实习，期间正式发布Neural MMO首个公开版本更早之前，他曾在李飞飞课题组、吴恩达实验室参与过研究项目。大约从2017年，他开始从事强化学习。当时，他在麻省理工学院Phillip Isola实验室攻读博士，开始创建开源计算研究平台Neural MMO。他的研究聚焦于推动现代基于智能体的学习方法向更复杂、更具认知真实性的环境拓展。后来，这个项目后来成为他整个博士生毕业论文的的主题。当时，各大实验室也在做从零开始、非语言模型的强化学习RL。事实上，这是当时大多数工作的重点：多智能体（multiagent）刚刚兴起，所有核心算法刚刚发布。 AlphaGo让研究者 ...

大语言模型

大语言模型