Workflow
TPU v6e
icon
Search documents
研报 | 受国际形势变化影响,2025年AI服务器出货年增幅度略减
TrendForce集邦· 2025-07-02 06:03
Google(谷歌) 今年受惠主权云项目以及东南亚新数据中心落成,显著提升Server需求。此外, Google本是自研芯片布局比例较高的业者,其针对AI推理用的TPU v6e已于上半年逐步放量成为主 流。 AWS(亚马逊云科技) 的自研芯片目前以Trainium v2为主力平台,据TrendForce集邦咨询了解, AWS已启动不同版本的Trainium v3开发,预计于2026年陆续量产。受惠于Trainium平台扩充与AI运 算自研策略加速,预估2025年AWS自研ASIC出货量将达双倍成长,为美系CSP最强。 和前四大CSP相比, Oracle(甲骨文) 更着重采购AI Server与IMDB( In-Memory Database ) Server。该公司今年将更积极布局AI Server基础设施,除整合自家核心业务云端数据库及AI应用外, 针对美国等主权云项目,其对NVIDIA GB Rack NVL72需求也明显提升。 此外,近期因国际形势变化,多数Server Enterprise OEM重新检视2025年下半年市场规划, 目前 TrendForce集邦咨询预估全年整体Server( 含通用型 ...
这种大芯片,大有可为
半导体行业观察· 2025-07-02 01:50
公众号记得加星标⭐️,第一时间看推送不会错过。 人工智能(AI)模型呈指数级增长,目前已达到万亿参数,这揭示了传统单芯片图形处理单元 (GPU)架构在可扩展性、能源效率和计算吞吐量方面的显著局限性。晶圆级计算已成为一种 变 革 性 的 范 式 , 它 将 多 个 小 芯 片 集 成 到 一 块 单 片 晶 圆 上 , 以 提 供 前 所 未 有 的 性 能 和 效 率 。 Cerebras晶圆级引擎(WSE-3)拥有4万亿晶体管和90万个核心,特斯拉的Dojo每个训练芯片拥 有1.25万亿晶体管和8,850个核心,这些平台都体现了晶圆级AI加速器满足大规模AI工作负载需 求的潜力。 本综述对晶圆级AI加速器和单芯片GPU进行了全面的比较分析,重点关注它们在高性能AI应用中的 相 对 性 能 、 能 源 效 率 和 成 本 效 益 。 同 时 , 也 探 讨 了 台 积 电 ( TSMC ) 的 晶 圆 上 芯 片 封 装 技 术 (CoWoS)等新兴技术,该技术有望将计算密度提高多达40倍。 此外,本研究还讨论了关键挑战,包括容错、软件优化和经济可行性,深入探讨了这两种硬件范式之 间的权衡和协同作用。此外,还 ...
推理芯片:英伟达第一,AMD第二
半导体行业观察· 2025-04-03 01:23
如果您希望可以时常见面,欢迎标星收藏哦~ 来源:内容 编译自 IEEE ,谢谢。 在 MLCommons 发布的最新一轮机器学习基准测试结果中,基于 Nvidia 全新 Blackwell GPU 架构 构 建的 计算 机表现优于其他 所有计算机。但 AMD 的最新 Instinct GPU MI325 却与其 竞争对手 Nvidia H200相媲美。两者的可比结果主要来自对较小规模大型语言模型之一Llama2 70B(700 亿 个参数)的测试。然而,为了跟上快速变化的人工智能格局,MLPerf增加了三个新基准测试,以更 好地反映机器学习的发展方向。 MLPerf 针对机器学习系统进行基准测试,旨在提供计算机系统之间的同类比较。提交者使用自己的 软件和硬件,但底层神经网络必须相同。目前共有 11 个服务器基准测试,今年又增加了 3 个。 MLPerf Inference 联 合 主 席 Miro Hodak 表 示 , " 很 难 跟 上 该 领 域 的 快 速 发 展 " 。 ChatGPT 直 到 2022 年底才出现,OpenAI于去年 9 月推出了其首个可以推理任务的大型语言模型 (LLM),LLM ...