Workflow
AlphaZero
icon
Search documents
我不给人做产品,给 Agent 做 | 42章经
42章经· 2025-06-29 14:48
本文来自 Grasp 创始人雷磊的播客及分享,有删减。 曲凯: Agent 今年这波热潮其实是 Manus 带起来的,到现在为止,各种 Agent 大家已经投得不少了。那下一个热点可能在哪里? 在这个服务主体转移的过程中,人类和 AI 的行为模式确实存在区别。 我们觉得可能是 Agent Infra。 正好雷磊现在做的 Grasp 就是一个给 Agent 用的浏览器。你是怎么想到要做Agent Infra 的? 雷磊: 首先,我相信未来 Agent 的数量会不断增加,至少会达到现在 SaaS 数量的几千倍。 而且 Agent 能直接交付结果,因此它其实就是一个数字员工,我们应该把它视为像人类一样的终端用户。但因为 Agent 与人类的形态截然不同,所以当下互联网的 很多基础设施都是不适合 AI 使用的,都需要为 Agent 重构一遍。 那基于这两点,Agent Infra 就是一个非常大的市场机会。 曲凯: 那未来 Agent 和人类到底会怎么协作?你提到说 Agent 和人类完全不同,具体有哪些体现? 雷磊: 现阶段大家普遍认为 Agent 是为人类服务的,但在我看来,未来应该是人类为 Agent 服务,因 ...
诺贝尔奖得主给你支招:AI时代年轻人该学什么 ?
老徐抓AI趋势· 2025-06-26 19:01
前言 AI时代,年轻人到底应该学什么? 类似的问题,很多AI大咖都讨论过,但我觉得戴密斯的观点会更加接近真相!! 以下内容,对于年轻人,可以看看怎么选就业方向; 对于家长和年轻观众们, 尤其是刚高考完,正在思考报什么专业的学生朋友们, 本篇内容尤其值得仔细看。 戴密 斯 · 哈萨 比斯 是何许人也? 戴密斯·哈萨比斯(Demis Hassabis)是英国人工智能科学家、企业家和神经科学博士,其经历堪称跨界传奇,主要可分为以下阶段: 天才少年与早期成就 国际象棋神童:4岁学棋,13岁达到大师水平。多次成为英国少年队队长。 学术跳级:16岁考入剑桥大学计算机系,20岁毕业。 游戏创业:毕业后创立游戏公司,开发多款畅销游戏,实现财务自由。 转向AI与神经科学 研究动机:认为人类大脑处理数据能力有限,希望通过AI创造"加强版大脑"加速科研。 深造神经科学:29岁攻读伦敦大学博士,研究大脑运作机制,为AI研究奠定基础。 创立DeepMind与AI里程碑 公司创立:2010年创办DeepMind,目标用AI解决复杂科学问题。 AGI,也就是通用人工智能什么时候会到来? 如果AGI的定义是能干人类会干的所有事,那人类还能干 ...
AI将受困于人类数据
3 6 Ke· 2025-06-16 12:34
2025 年 6 月 6 日,第七届北京智源大会在北京正式开幕,强化学习奠基人、2025年图灵奖得主、加拿大计算机科学家Richard S. Sutton以"欢迎来到经验时 代"为题发表主旨演讲,称我们正处在人工智能史上从"人类数据时代"迈向"经验时代"的关键拐点。 Sutton指出,当今所有大型语言模型依赖互联网文本和人工标注等"二手经验"训练,但高质量人类数据已被快速消耗殆尽,新增语料的边际价值正急剧下 降;近期多家研究也观察到模型规模继续膨胀却收效递减的"规模壁垒"现象,以及大量科技公司开始转向合成数据。 在Sutton看来,要突破这一极限,智能体必须像婴儿学习玩具、足球运动员在赛场决策那样,通过与环境交互不断生成并利用第一手经验,而非单纯模仿 人类旧有文本。这一观点呼应了Alan Turing1947年就已提出的预言——"我们想要的是一台能够从经验中学习的机器"——为人工智能奠定了早期哲学基 础。Sutton与长期合作者Andrew Barto凭借强化学习框架将这一理念工程化,并因此荣膺2024/25年度图灵奖,强化学习也在AlphaGo、机器人控制等里程 碑项目中反复验证其可行性。 在他看来,让智能 ...
AI将受困于人类数据
腾讯研究院· 2025-06-16 09:26
晓静 腾讯科技《AI未来指北》特约作者 2025 年 6 月 6 日,第七届北京智源大会在北京正式开幕,强化学习奠基人、2025年图灵奖得主、加拿 大计算机科学家Richard S. Sutton以"欢迎来到经验时代"为题发表主旨演讲,称我们正处在人工智能史上 从"人类数据时代"迈向"经验时代"的关键拐点。 Sutton指出,当今所有大型语言模型依赖互联网文本和人工标注等"二手经验"训练,但高质量人类数据 已被快速消耗殆尽,新增语料的边际价值正急剧下降;近期多家研究也观察到模型规模继续膨胀却收效 递减的"规模壁垒"现象,以及大量科技公司开始转向合成数据。 以下为演讲全文: 当前大型模型已逼近"人类数据"边界,唯有让智能体通过与环境实时交互来生成可随能力指数级扩 张的原生数据,AI 才能迈入"经验时代" 。 真正的智能应像婴儿或运动员那样在感知-行动循环中凭第一人称经验自我学习 。 强化学习范例(如 AlphaGo、AlphaZero)已证明从模拟经验到现实经验的演进路径,未来智能体 将依靠自生奖励和世界模型实现持续自我提升 。 基于恐惧的"中心化控制"会扼杀创新,多主体维持差异化目标并通过去中心化合作实现双赢 ...
让你的公司像大脑一样思考、连接与成长
3 6 Ke· 2025-06-09 11:51
企业和大脑一样——能否成功,关键在于预测。 大脑的任务不是完美控制,而是不断修正认知,最小化意外。企业亦如此。那些在市场中胜出的公司, 并不是最聪明的,而是拥有最准确"世界模型"、能快速适应变化的组织。 如果你的公司还在用僵化的流程和KPI试图"管控未来",那就像用算盘应对高频交易的市场。唯有像神 经网络一样,让组织结构具备联通性、适应性和实时反馈机制,才能真正在复杂世界中减少意外、提升 绩效。 接下来,我们将带你重新理解企业设计的底层逻辑——从神经启发到组织物理学,如何训练你的公司 像"大脑"一样预测、学习并持续进化。 是供应链突然中断?客户流失?还是团队内耗导致项目崩盘? 每个领导者都曾遇到过这样的瞬间:原本预期顺利推进的事情,突然偏离轨道。更糟的是,我们往往是 在结果出来之后,才意识到哪里出了问题。而这种"事后才知"的反应机制,正是组织失效的症结所在。 比如,每天早上你去端一杯咖啡时,大脑会自动预测:你伸手握住杯子,杯子靠近嘴唇,然后尝到咖啡 的味道。但如果你没拿稳,咖啡洒了,大脑就会立刻记录这次"失败",下次尝试更稳妥的动作。你可能 会换一只好握的杯子,或者喝之前先确认杯子的位置。每次意外,都是大脑在 ...
DeepMind CEO 放话:未来十年赌上视觉智能,挑战 OpenAI 语言统治地位
AI前线· 2025-04-25 08:25
整理|冬梅、核子可乐 去年成功斩获诺贝尔奖之后,Demis Hassabis 决定与一位国际象棋世界冠军打场扑克以示庆 祝。Hassabis 一直痴迷于游戏,这股热情也成为他 AI 先驱之路上的契机与驱力。 近日,做客一档名为《60 分钟》的访谈栏目,讲述了他如何带领众多研究者追逐新的技术"圣 杯"——通用人工智能(AGI),一种兼具人类灵活性与超人般速度与知识储备的硅基智能形态。 除此之外,他也在访谈中透露了 DeepMind 未来的研究方向以及有可能亮相的产品和技术。 "天才少年"Hassabis AI 之旅始于国际象棋 Hassabis 于 2010 年与他人共同创立了了 AI 公司 DeepMind,2014 年该公司被谷歌以 5 亿多 美元收购。2017 年,他发明了 AI 算法 AlphaZero,它只需要国际象棋规则和四个小时的自对 弈,就能成为有史以来最强的国际象棋选手,击败人类国际象棋大师。 2024 年,Hassabis 与同为诺贝尔化学奖得主的 DeepMind 总监约翰·江珀 (John Jumper) 共同 获得了诺贝尔化学奖,获奖原因是他创建了一个 AI 模型 AlphaFold2 ...