SemiAnalysis GTC深度解读:三款新系统背后,英伟达正在重新定义AI基础设施的边界
在GTC 2026大会上,英伟达一口气推出三款全新系统——Groq LPX推理机架、Vera ETL256 CPU机架与STX存储参考架构,将其产品版图从GPU算力核心 向低延迟推理、CPU编排与存储层全面延伸,标志着英伟达正系统性地重构AI基础设施的定义边界。 LP30以单一整体裸片形式存在,无需先进封装。值得关注的是,SF4工艺不挤占英伟达在台积电N3上的稀缺产能配额,也不消耗同样紧张的HBM资源,因 此LPX系统代表的是真正意义上的增量产能与增量收入,据SemiAnalysis指出,这是竞争对手无法复制的差异化优势。 LPU的核心价值与天然局限 LPU架构的竞争优势在于高带宽SRAM与确定性流水线执行机制,这使其在单用户低延迟场景下具备GPU难以企及的首token生成速度。然而,高密度SRAM 的代价是容量受限——权重加载后所剩空间极为有限,随批量增大KV Cache迅速饱和,整体吞吐量显著弱于GPU。 据SemiAnalysis分析,独立部署的LPU系统在大规模token服务上并不经济,但在对延迟极度敏感的场景中可获取可观的溢价,这正是LPU在解耦解码系统中 的定位基础。 其中最受市场关注的是Groq ...