Workflow
LPU推理方案
icon
Search documents
gtc大会速递
2026-03-18 02:31
gtc 大会速递 20260317 摘要 AI for AI 趋势明确,Meta 等大厂员工单日 Token 消耗最高近万美金, 驱动算力与存储需求呈现无上限增长态势。 英伟达在手订单展望由 5,000 亿增至 1 万亿美金,支撑 2027 年持续 增长,但测算增速未显著超市场预期。 Rubin Ultra 架构确认 NVR144 方案,单柜集成 144 颗 GPU,采用正 交背板互联,预计 2027 年下半年量产。 LPU 推理方案取代 CPX 成为重点,单柜含 256 颗芯片,采用"八卡 OEM+UBB"架构,PCB 价值量较 CPX 显著提升。 新增独立 CPU 与存储机柜以应对 Agent AI 任务分配与低延迟需求,带 动 PCIe 协议相关 PCB 增量及 TAM 持续膨胀。 技术路线演进趋于渐进,Blackwell 架构中 CPO 与铜互联将长期共存, 现有技术迭代并非颠覆式更替。 Q&A 2026 年硅谷 AI 行业的整体发展趋势和市场关注焦点是什么? 2026 年硅谷 AI 行业的关键词是 Agent 的爆发。相较于 2025 年行业发展更多 体现为模型端的进步,2026 年的共识是 Age ...