PCB 设备系列跟踪报告(三):GTC 大会前瞻:重视 LPU 对 PCB 设备和钻针带来的增量需求
2026 年 3 月 2 日 行业研究 GTC 大会前瞻:重视 LPU 对 PCB 设备和钻针带来的增量需求 ——PCB 设备系列跟踪报告(三) 要点 事件:据新浪财经报道,英伟达计划在 2026 年 3 月的 GTC 开发者大会上发布 一款整合了 Groq"语言处理单元"(LPU)技术的全新推理芯片。 LPU 具有低时延高带宽特点,与 GPU 在 AI 工作流中形成互补。 LPU(Language Processing Unit)是一种专为 AI 推理,特别是低延迟实时交互(如对话)设计 的专用处理器,其核心是通过"编译器驱动"的静态调度实现确定性执行,并依 赖高速片上 SRAM(带宽可达 80TB/s)来消除内存瓶颈,从而将首词延迟降至 约百毫秒内,在主流大模型(以 Llama2-70B 模型为例)推理上比 H100 GPU 快约 10 倍,综合能效可提升约 10 倍。相比之下,GPU(如 H100)是通用高吞 吐架构,依赖大容量 HBM 显存,擅长大规模并行计算,是大模型训练和高吞吐 量任务的主力,但在单序列、实时生成的场景中会受限于内存带宽和运行时调度, 难以突破低延迟瓶颈。LPU 与 GPU 在 A ...