Workflow
Torus结构
icon
Search documents
谷歌TPU架构解析
2025-12-01 00:49
谷歌 TPU 架构解析 20251130 站在 2025 年 11 月底,展望 2026 年,我们对整个高增长的新兴板块持非常乐 观的态度。以谷歌 Gemini 和 TPU 为代表的产品和形态,对行业产生了重大影 响。尤其是 AI 领域,未来前景非常乐观。谷歌推出 TPU 后,进一步强化了市 场对 AI 投入的信心。此外,谷歌不仅拥有强大的 AI 应用生态系统,还在网络 架构方面发挥了重要作用,如全球领先的 OCS(Optical Circuit Switching) 技术。 谷歌的 Scale Up 架构采用 Torus(环面)结构,具有循环连接的特点, 没有边界,K 维度的 Torus 结构中每个节点连接 2K 个相邻节点,保证 了 Rack 内部和 Rack 之间的高效连接。 谷歌早期推理和训练集群分离,随着多模态需求增加,V7 及后续版本逐 渐实现训推一体化,采用 2D Torus 架构,边缘节点使用光模块进行跨 柜连接,128 张卡的推理集群中约有 64 个光模块。 未来谷歌每代 TPU 卡带宽预计将翻倍,V8 架构中 1.6T 光模块的比例可 能达到 1:4.5 至 1:6,并可能从 DAC 转向 ...