中心化控制

Search documents
AI将受困于人类数据
3 6 Ke· 2025-06-16 12:34
2025 年 6 月 6 日,第七届北京智源大会在北京正式开幕,强化学习奠基人、2025年图灵奖得主、加拿大计算机科学家Richard S. Sutton以"欢迎来到经验时 代"为题发表主旨演讲,称我们正处在人工智能史上从"人类数据时代"迈向"经验时代"的关键拐点。 Sutton指出,当今所有大型语言模型依赖互联网文本和人工标注等"二手经验"训练,但高质量人类数据已被快速消耗殆尽,新增语料的边际价值正急剧下 降;近期多家研究也观察到模型规模继续膨胀却收效递减的"规模壁垒"现象,以及大量科技公司开始转向合成数据。 在Sutton看来,要突破这一极限,智能体必须像婴儿学习玩具、足球运动员在赛场决策那样,通过与环境交互不断生成并利用第一手经验,而非单纯模仿 人类旧有文本。这一观点呼应了Alan Turing1947年就已提出的预言——"我们想要的是一台能够从经验中学习的机器"——为人工智能奠定了早期哲学基 础。Sutton与长期合作者Andrew Barto凭借强化学习框架将这一理念工程化,并因此荣膺2024/25年度图灵奖,强化学习也在AlphaGo、机器人控制等里程 碑项目中反复验证其可行性。 在他看来,让智能 ...
AI将受困于人类数据
腾讯研究院· 2025-06-16 09:26
晓静 腾讯科技《AI未来指北》特约作者 2025 年 6 月 6 日,第七届北京智源大会在北京正式开幕,强化学习奠基人、2025年图灵奖得主、加拿 大计算机科学家Richard S. Sutton以"欢迎来到经验时代"为题发表主旨演讲,称我们正处在人工智能史上 从"人类数据时代"迈向"经验时代"的关键拐点。 Sutton指出,当今所有大型语言模型依赖互联网文本和人工标注等"二手经验"训练,但高质量人类数据 已被快速消耗殆尽,新增语料的边际价值正急剧下降;近期多家研究也观察到模型规模继续膨胀却收效 递减的"规模壁垒"现象,以及大量科技公司开始转向合成数据。 以下为演讲全文: 当前大型模型已逼近"人类数据"边界,唯有让智能体通过与环境实时交互来生成可随能力指数级扩 张的原生数据,AI 才能迈入"经验时代" 。 真正的智能应像婴儿或运动员那样在感知-行动循环中凭第一人称经验自我学习 。 强化学习范例(如 AlphaGo、AlphaZero)已证明从模拟经验到现实经验的演进路径,未来智能体 将依靠自生奖励和世界模型实现持续自我提升 。 基于恐惧的"中心化控制"会扼杀创新,多主体维持差异化目标并通过去中心化合作实现双赢 ...