成本暴降70%!谷歌TPU强势追赶,性价比已追平英伟达

在AI资本开支仍维持高位、但商业化压力不断上升的当下,市场关注点正在发生一场悄然却深刻的转 移:大模型还能不能继续"无视成本地跑下去"。 据追风交易台,高盛最新发布的AI芯片研究报告,并未延续市场熟悉的"算力、制程、参数规模"对比, 而是从更贴近商业现实的角度切入——推理阶段的单位成本。通过构建一条"推理成本曲线",高盛试图 回答一个对AI产业至关重要的问题:在模型进入高频调用阶段后,不同芯片方案在折旧、能耗和系统 利用率等约束下,每处理一百万个token究竟需要付出多少真实成本。 研究结论指向了一次正在加速、但尚未被充分消化的变化:Google/Broadcom 的TPU正在迅速缩小与英 伟达GPU在推理成本上的差距。从TPU v6升级至TPU v7,单位token推理成本下降约70%,使其在绝对 成本层面与英伟达GB200 NVL72基本持平,部分测算情形下甚至略具优势。 这并不意味着英伟达的地位被动摇,但它清晰地表明,AI芯片竞争的核心评价体系正在从"谁算得更 快",转向"谁算得更便宜、更可持续"。当训练逐渐成为前期投入,而推理成为长期现金流来源,成本 曲线的斜率,正在取代峰值算力,成为决定产业格局的关 ...