报道:英伟达在下月GTC大会推出“新推理芯片”,融入Groq LPU设计

英伟达计划在下个月的GTC开发者大会上发布一款整合了Groq"语言处理单元"(LPU)技术的全新推理 芯片,代表着英伟达正加速向推理计算领域转型,以应对客户对高效能、低成本计算方案的迫切需求。 据华尔街日报报道,这款被英伟达首席执行官黄仁勋称为"世界从未见过"的全新系统,专为加速AI模型 的查询响应而设计。该产品的推出预计将重塑当前的AI算力市场格局,直接影响正在寻找更具成本效 益替代方案的云服务提供商和企业级投资者。 业内分析认为,即将发布的新品可能涉及具备颠覆性的下一代Feynman架构。据华尔街见闻此前文章, Feynman架构可能采用更广泛的SRAM集成方案,甚至通过3D堆叠技术将LPU深度整合其中,专门针对 延迟和内存带宽这两大推理瓶颈进行优化,从而大幅降低AI智能体运行的能耗与成本。 拓展纯CPU部署,提供多元化计算选择 在引入LPU架构的同时,英伟达也在灵活调整其传统处理器的使用方式。英伟达以往的标准做法是将 Vera CPU与其强大的Rubin GPU捆绑在数据中心服务器中,但在处理某些特定的AI智能体工作负载时, 这种配置被证明成本过高且能效不足。 部分大型企业客户发现,纯CPU环境在运行特 ...

Nvidia-报道:英伟达在下月GTC大会推出“新推理芯片”,融入Groq LPU设计 - Reportify