CPU何以站上“算力C位”?
财联社·2026-02-01 02:48

以下文章来源于科创板日报 ,作者张真 科创板日报 . 专注科创板和科技创新,上海报业集团主管主办,界面财联社出品。 最新研究显示,在完整的Agent执行链路中,工具处理相关环节在CPU上消耗的时间占端到端延迟的比例最高可达90.6%。在高并发场景 下,CPU端到端延迟从2.9秒跃升至6.3秒以上。其结果揭示了在大量Agentic场景中,系统吞吐受限的并非GPU计算能力,而是CPU的核心 数并发调度问题。 至于为何CPU负载高于GPU,在东吴证券看来,Agent时代AI由"纯对话"转向了"执行任务",因此产生大量if/else判断,这种"分支类任 务"倘若由GPU执行,会因控制流发散导致算力利用率急剧下降。与之相比,CPU的微架构却能够适应此类任务。 就在日前,GPU的超级玩家英伟达主动掏出20亿美元追加认购CoreWeave股票,并声称后者将在其平台上部署Vera CPU—— 一款专 为"代理式推理(Agentic Reasoning)"设计,且在大规模AI工厂最具能效优势的CPU。 据悉,因ARM CPU瓶颈,英伟达已计划在下一代 Rubin架构中大幅提升CPU核心数,并开放NVL72机柜对x86CPU的支 ...

CPU何以站上“算力C位”? - Reportify