带宽战争前夜,“中国版Groq”浮出水面

在AI算力赛道,英伟达凭借Hopper、Blackwell、Rubin等架构GPU,早已在AI训练领域建立起了难以撼动的技术壁垒与行业地位。但随着 即时AI场景需求爆发,传统GPU在面对低批处理、高频交互推理任务中的延迟短板愈发凸显。 为破解这一痛点,英伟达重磅出击,斥资200亿美元收购Groq核心技术,抢跑AI推理市场。 这一金额不仅创下英伟达历史最大手笔交易、刷新了推理芯片领域的估值纪录,更鲜明地昭示着英伟达从"算力霸主"向"推理之王"转型的意志。 紧随这一动作,据技术博主AGF消息进一步披露,英伟达计划在2028年推出新一代Feynman架构GPU——采用台积电A16先进制程与SoIC 3D堆叠 技术,核心目的正是为了在GPU内部深度集成Groq那套专为推理加速而生的LPU(语言处理单元),相当于给GPU加装了一个专门处理语言类推理 任务的专属引擎,直指AI推理性能中长期存在的"带宽墙"与"延迟瓶颈"。 回看中国市场,AI浪潮推动下,国产大模型多点突破、强势崛起,本土AI芯片企业集体爆发并密集冲击IPO,资本热度居高不下。 然而,当英伟达选择通过Feynman架构来补齐推理短板时,就意味着谁能率先解决" ...