英伟达(NVDA.US)的又一场“阳谋”
过去二十年,数据中心的性能进步主要依赖于计算芯片——CPU、GPU、FPGA 不断演进,但进入生成式 AI 时代后,整个算力体系开始被网络重新定 义。在大模型训练中,GPU 间的通信延迟与带宽瓶颈,已经成为训练效率的关键约束。尤其当模型参数突破万亿级,单个GPU已难以承担任务,必须通 过数千、数万张 GPU 的并行协同来完成训练。 在这一过程中,网络的重要性愈发凸显,近日,行业内的一则大消息是:Meta/Oracle两大科技巨头选择了NVIDIA Spectrum-X以太网交换机与相关技术。 此举被业界视为以太网向AI专用互连迈出的重要一步。 同时也反映出英伟达(NVDA.US)正在加速向开放以太网生态渗透,绑定云巨头与企业客户。英伟达已经凭借 InfiniBand控制了封闭的高端网络,如今又 正在"开放"的以太网生态中设下第二道围墙。 Spectrum-X,以太网AI化 过去几十年,以太网是数据中心采用最为广泛的网络。但在AI为核心的时代,AI 的核心挑战不在单个节点的算力,而在分布式架构下的协同效率。训练 一个基础模型(如 GPT、BERT、DALL-E),需要跨节点同步海量梯度参数。整个训练过程的速度, ...