经验时代

Search documents
AI将受困于人类数据
3 6 Ke· 2025-06-16 12:34
2025 年 6 月 6 日,第七届北京智源大会在北京正式开幕,强化学习奠基人、2025年图灵奖得主、加拿大计算机科学家Richard S. Sutton以"欢迎来到经验时 代"为题发表主旨演讲,称我们正处在人工智能史上从"人类数据时代"迈向"经验时代"的关键拐点。 Sutton指出,当今所有大型语言模型依赖互联网文本和人工标注等"二手经验"训练,但高质量人类数据已被快速消耗殆尽,新增语料的边际价值正急剧下 降;近期多家研究也观察到模型规模继续膨胀却收效递减的"规模壁垒"现象,以及大量科技公司开始转向合成数据。 在Sutton看来,要突破这一极限,智能体必须像婴儿学习玩具、足球运动员在赛场决策那样,通过与环境交互不断生成并利用第一手经验,而非单纯模仿 人类旧有文本。这一观点呼应了Alan Turing1947年就已提出的预言——"我们想要的是一台能够从经验中学习的机器"——为人工智能奠定了早期哲学基 础。Sutton与长期合作者Andrew Barto凭借强化学习框架将这一理念工程化,并因此荣膺2024/25年度图灵奖,强化学习也在AlphaGo、机器人控制等里程 碑项目中反复验证其可行性。 在他看来,让智能 ...
AI将受困于人类数据
腾讯研究院· 2025-06-16 09:26
晓静 腾讯科技《AI未来指北》特约作者 2025 年 6 月 6 日,第七届北京智源大会在北京正式开幕,强化学习奠基人、2025年图灵奖得主、加拿 大计算机科学家Richard S. Sutton以"欢迎来到经验时代"为题发表主旨演讲,称我们正处在人工智能史上 从"人类数据时代"迈向"经验时代"的关键拐点。 Sutton指出,当今所有大型语言模型依赖互联网文本和人工标注等"二手经验"训练,但高质量人类数据 已被快速消耗殆尽,新增语料的边际价值正急剧下降;近期多家研究也观察到模型规模继续膨胀却收效 递减的"规模壁垒"现象,以及大量科技公司开始转向合成数据。 以下为演讲全文: 当前大型模型已逼近"人类数据"边界,唯有让智能体通过与环境实时交互来生成可随能力指数级扩 张的原生数据,AI 才能迈入"经验时代" 。 真正的智能应像婴儿或运动员那样在感知-行动循环中凭第一人称经验自我学习 。 强化学习范例(如 AlphaGo、AlphaZero)已证明从模拟经验到现实经验的演进路径,未来智能体 将依靠自生奖励和世界模型实现持续自我提升 。 基于恐惧的"中心化控制"会扼杀创新,多主体维持差异化目标并通过去中心化合作实现双赢 ...
强化学习之父Richard Sutton:人类数据耗尽,AI正在进入“经验时代”!
AI科技大本营· 2025-06-06 10:18
文 | 郑丽媛 出品丨AI 科技大本营(ID:rgznai100) 过去这一年,AI 世界风云再起。 从 DeepSeek R1 、OpenAI o3 的激烈竞逐,到 AI 智能体频频登上技术热榜;从"推理能力"成为衡量大模型的新标准,到人形机器人、具身智能 (Embodied Intelligence)被寄予厚望……我们正站在 AI 技术快速演进的关键时刻。 然而,在这些热闹表象的背后,一场更深层的技术讨论也正在 悄然发生: 我们真的了解智能吗?我们构建的 AI 真的在"学习"吗? 在这样一个值得深思的节点, 加拿大阿尔伯塔大学计算科学系教授、图灵奖得主 Richard Sutton 在 6 月 6 日举行的北京智源大会上,带来了一场名为 《 欢迎来到经验时代 (Welcome to the Era of Experience) 》的 主题演讲。 在 整场演讲中, Richard Sutton 没有谈模型架构、参数量,没有讲热门的大语言模型, 也没有 讨论 多模态系统的未来路线图——他选择回到 AI 的第 一性原理, 提出了一个颠覆直觉、却极具穿透力的主张: 真正的智能,应该来源于经验,而不是人类预设的数据 ...