NVIDIA Vera Rubin NVL144 CPX平台

Search documents
刚刚,英伟达祭出下一代GPU!狂飙百万token巨兽,投1亿爆赚50亿
猿大侠· 2025-09-11 04:11
转自:新智元 编辑:元宇 「百万Token怪兽」出世! 昨天,NVIDIA突放大招, 推出了Rubin CPX ,这是一款专为大规模上下文推理而设计的全新 GPU。 它的性能,是Vera Rubin NVL144平台的2倍多,是基于Blackwell Ultra的GB300 NVL72机架式 系统的7.5倍! 它具有单机架8 EFLOPS的NVFP4计算力、100TB高速内存与1.7 PB/s的内存带宽、128GB的高 性价比GDDR7显存。 相比较NVIDIA GB300 NVL72系统,Rubin CPX带来了3倍的注意力机制处理能力。 性能巨兽,在变现能力上更是不容小觑。 每投入1亿美元,最高可以带来50亿美元的Token收入! Rubin CPX 开创CPX全新处理器类别 Rubin CPX基于Rubin架构构建,是首款专为海量上下文AI打造的CUDA GPU,能够在同一时间推 理跨越数百万个知识标记的模型。 可以说, Rubin CPX是专为破解 AI 「长上下文」瓶颈而生的「特种兵」。 Rubin CPX通过解耦式推理创新,可以企业带来30-50倍ROI,重写推理经济。 大模型的推理,主要分为上下 ...
英伟达下一代GPU登场,Rubin CPX一次推理数百万Token,网友:这是头野兽
机器之心· 2025-09-10 08:14
机器之心报道 机器之心编辑部 在周二的 AI 基础设施峰会上,英伟达宣布推出一款名为 Rubin CPX(Rubin Context GPUs) 的新 GPU,专为超过 100 万 token 的长上下文推理而设计。 对用户而言,这意味着他们在软件开发、视频生成等长上下文任务中能够获得更好的性能。 例如,在软件开发中,AI 系统必须能够对整个代码库进行推理、理解仓库级代码结构,才能更好的帮助开发者。同样地,长视频和研究类应用也要求在数百万 token 范围内保持持续的连贯性和记忆。 现在,随着 Rubin CPX 发布,这些问题都能迎刃而解。 这款新型 GPU(Rubin CPX) 将与 NVIDIA Vera CPU 和 Rubin GPU 搭配使用,共同组成全新的 NVIDIA Vera Rubin NVL144 CPX 平台。这一集成式 NVIDIA MGX 系统在单机架内可提供 8 exaflops AI 算力,其 AI 性能是 NVIDIA GB300 NVL72 系统的 7.5 倍,并配备 100TB 高速内存和 1.7 PB/s(petabytes)内存带宽。 同时,NVIDIA 还将为已有 V ...