盲编码
Search documents
英伟达Agent超越人类GPU专家!连续7天自主进化,优化算子性能碾压FlashAttention-4
量子位· 2026-03-28 06:33
还得是 英伟达 !一出手,GPU开发变天了。 鹭羽 发自 凹非寺 量子位 | 公众号 QbitAI 什么概念呢? 同一款GPU上,AVO方案性能超出官方加速引擎cuDNN 3.5%,比当前公认最强的FlashAttention-4还快了10.5% 。 更厉害的是, 优化后能直接复用 ,30分钟就能适配到另一种注意力机制上,而运算速度依旧遥遥领先。 要知道,目前人类专家对这类底层算子的优化已逼近硬件极限,结果现在智能体还能将这个极限再往上调一调。 用第一作者许冰的话说,就是: 这或许是软件领域首次出现 超人类智能 的实质性迹象。 英伟达最新发布智能体变异算子 AVO (Agentic Variation Operator) ,直接刷屏社媒,原因很简单—— 7天时间,无需人工干预, 自动进化 出超越几乎所有人类GPU专家的注意力机制优化方案。 这一最新成果迅速在社交媒体上被热议,不少网友认为: 这就是GPU编码的 AlphaGo时刻 。 连续7天的搜索量已经相当于博士生一年的工作量。 具体操作流程包括四步: AVO的核心设计 其实除了人类专家,也有人尝试用大模型辅助优化代码,比如FunSearch、AlphaEv ...