Workflow
磁性流式处理(MSA)架构
icon
Search documents
带宽战争前夜,“中国版Groq”浮出水面
半导体行业观察· 2026-01-15 01:38
在AI算力赛道,英伟达凭借Hopper、Blackwell、Rubin等架构GPU,早已在AI训练领域建立起了难以撼动的技术壁垒与行业地位。但随着 即时AI场景需求爆发,传统GPU在面对低批处理、高频交互推理任务中的延迟短板愈发凸显。 为破解这一痛点,英伟达重磅出击,斥资200亿美元收购Groq核心技术,抢跑AI推理市场。 这一金额不仅创下英伟达历史最大手笔交易、刷新了推理芯片领域的估值纪录,更鲜明地昭示着英伟达从"算力霸主"向"推理之王"转型的意志。 紧随这一动作,据技术博主AGF消息进一步披露,英伟达计划在2028年推出新一代Feynman架构GPU——采用台积电A16先进制程与SoIC 3D堆叠 技术,核心目的正是为了在GPU内部深度集成Groq那套专为推理加速而生的LPU(语言处理单元),相当于给GPU加装了一个专门处理语言类推理 任务的专属引擎,直指AI推理性能中长期存在的"带宽墙"与"延迟瓶颈"。 这些动作表明:AI行业的竞争正从单纯的算力比拼,转向对单位面积带宽的极致追求——这与英伟达此前"大模型推理90%的延迟源于数据搬运,导 致算力利用率常低于30%"的结论不谋而合。 然而,当英伟达选择通过 ...