英伟达的“神秘芯片”背后--推理时代开启“四大算力新趋势”

英伟达整合LPU(语言处理单元)技术、OpenAI多线押注推理芯片,正在将AI算力竞争的主战场从训练切换至推理。申万宏源研究认为,2026年 算力产业的核心关键词将是推理,Token消耗总量与技术范式均将围绕这一主题深度重构。 2月28日,据《华尔街日报》报道,英伟达计划在下月的GTC开发者大会上发布一款整合了Groq"语言处理单元"(LPU)技术的全新推理芯片,英 伟达首席执行官黄仁勋称其为"世界从未见过"的全新系统。OpenAI已同意成为该处理器的最大客户之一,并将向英伟达购买大规模"专用推理产 能"。 与此同时,OpenAI上月还与初创公司Cerebras达成数十亿美元计算合作,后者称其推理芯片速度已超越英伟达GPU(图形处理器)。这一系列动 向表明,AI巨头正在从训练算力的军备竞赛,转向推理算力的多线布局。 申万宏源报告指出,Token经济时代,推理算力正迎来四大趋势:一是纯CPU(中央处理器)部署场景增多,低成本推理需求加速算力下沉;二 是LPU等专用架构崛起,挑战GPU在推理环节的主导地位;三是国产算力芯片加速突破,供应链多元化趋势明确;四是推理算力的需求结构从"单 次训练"向"海量Token消耗 ...