Workflow
解耦式推理
icon
Search documents
英伟达祭出下一代GPU,狂飙百万token巨兽,投1亿爆赚50亿
3 6 Ke· 2025-09-11 02:45
9日,英伟达重磅发布了专为海量上下文AI打造的CUDA GPU——Rubin CPX,将大模型一次性推理带入「百万Token时代」。NVIDIA创始人 兼CEO黄仁勋表示,Vera Rubin平台将再次推动AI计算的前沿,不仅带来下一代Rubin GPU,也将开创一个CPX的全新处理器类别。 「百万Token怪兽」出世! 昨天(9日),NVIDIA突放大招,推出了Rubin CPX,这是一款专为大规模上下文推理而设计的全新GPU。 它的性能,是Vera Rubin NVL144平台的2倍多,是基于Blackwell Ultra的GB300 NVL72机架式系统的7.5倍! 它具有单机架8 EFLOPS的NVFP4计算力、100TB高速内存与1.7 PB/s的内存带宽、128GB的高性价比GDDR7显存。 相比较NVIDIA GB300 NVL72系统,Rubin CPX带来了3倍的注意力机制处理能力。 性能巨兽,在变现能力上更是不容小觑。 每投入1亿美元,最高可以带来50亿美元的Token收入! Rubin CPX开创CPX全新处理器类别 Rubin CPX基于Rubin架构构建,是首款专为海量上下文AI打造 ...