不再卷算力的2026,英伟达开始重做数据中心

2026 年,AI 数据中心发展进入了一个新的瓶颈阶段。 单纯的算力堆砌似乎已经走到了尽头,随着代理式 AI 的兴起、混合专家模型(MoE)的普及,以及百万 token 级长上下文逐渐成为常态,大型云 厂商开始意识到,竞争的关键不再是谁拥有更多 GPU,而是谁能更高效地使用,谁能把系统整体效率真正拉起来。 但传统数据中心的短板已经暴露无遗:当代理式 AI 需要处理多轮复杂对话时,它必须频繁调用不同的专家模型,同时保持对历史上下文的准确记 忆。在这个过程中,GPU 可能大部分时间处于等待状态——等待数据从内存传输过来,等待网络将其他节点的计算结果送达,等待存储系统调出历 史记忆。 正是在这样的背景下,英伟达在 CES 2026 上正式发布了 Rubin 平台和 BlueField-4。它们并非是一次硬件的常规升级,而是对传统数据中心低效 这一症结开出的新处方,从某种意义上说,英伟达"重做了一次数据中心",构建起了真正面向 AI 原生时代的硬件底座。 我们先从一切计算工作的核心——Rubin 平台说起。 与以往围绕单一核心器件不断迭代的路径不同,Rubin 最显著的变化在于,它从一开始就放弃了"单点升级"的思路, ...