亚马逊部署100万自研芯片,预言下一代
在与华尔街分析师讨论亚马逊及其亚马逊网络服务云的财务业绩的电话会议上,数据中心的核心主题 是 Trainium2 进展非常顺利,而与模型构建者和紧密合作伙伴 Anthropic 共同开发的 Trainium3 加 速器(该加速器已于去年 12 月在 re:Invent 2024 大会上进行了预览)也即将投入使用。 我 们 在 2023 年 12 月 就 对 Trainium2 芯 片 进 行 了 预 览 , 现 在 需 要 更 新 芯 片 的 实 际 规 格 。 关 于 Trainium3,我们了解不多,只知道它采用台积电3纳米工艺制造,性能是现有Trainium2芯片的两 倍,能效提升40%(我们推测这意味着每瓦浮点运算次数更高)。 与其他云服务商一样,亚马逊也在努力寻求平衡:一方面利用自研加速器提升利润并支撑人工智能平 台服务;另一方面,为那些希望在云端构建自有平台的用户提供来自英伟达(有时也包括AMD)的 海量GPU算力。目前,只有谷歌的TPU和AWS的Trainium广泛部署了自主研发的AI训练加速器。微 软仍在研发其Maia芯片,Meta Platforms的MTIA加速器的训练版本也尚未完成。(中 ...