Workflow
傅里叶的猫
icon
Search documents
HBM Roadmap和HBM4的关键特性
傅里叶的猫· 2025-06-18 13:26
今天我们来看下KAIST TERALAB在前两天的一次workshop中公布的一些关于HBM的技术。KAIST 实验室在高带宽内存(HBM)设计技术方面处于世 界领先地位,由被部分业内人士称为 "HBM 之父" 的 Kim Joungho 教授领导,在 HBM 领域有诸多开创性的研究成果。2017 年 Kim Joungho 教授首次 正式公布了 Kim 法则,该法则对半导体行业的长期规划和研发目标设定起到了重要的指导作用。在前几天,该实验室举办了关于下一代 HBM 路线图 的技术展示会,介绍了从 HBM4 到 HBM8 的长期路线图,涵盖 HBM 架构、冷却方法、TSV 密度、中介层等方面的进展。 这个ppt有371页,内容比较多,这篇文章我们先看HBM Roadmap Overview和HBM4 Key features两部分。 HBM Roadmap Overview 在数据爆炸式增长与 AI 计算需求狂飙的时代,存储器技术正经历着前所未有的变革。高带宽存储器(HBM)作为突破 "内存墙" 的关键技术,其 roadmap展现了从单纯容量升级到计算存储融合的全维度进化。 HBM 的发展始终围绕 "更高带宽 ...
半壁江山都来了!中国AI算力大会演讲嘉宾全揭晓,同期异构混训、超节点两大研讨会议程公布
傅里叶的猫· 2025-06-17 15:30
6月26日, 2025中国AI算力大会 将在北京中关村东升科技园万丽酒店正式举行! 作为智一科技旗下 智猩猩 与 智东西 共同发起主办、 芯东西 协办的首届AI算力大会,本次大会计划邀请近 30位重量级嘉宾与会带来致辞、报告、演讲和对话,全方位解构DeepSeek引爆的AI算力变局。同时,大会 也是"智领未来"北京人工智能系列活动之一。 2025中国AI算力大会设有主会场、分会场和展览区。其中,主会场将进行 高峰论坛、AI推理算力专题论坛 和智算中心专题论坛 ,分 会场全天将分别进行 智算集群异构混训技术研讨会、超节点技术研讨会 。其 中,分会场的两场研讨会为闭门制,主要面向持有闭门专享票、贵宾通票的观众开放。 | | | 2025中国AI算力大会 | | | --- | --- | --- | --- | | | | 主办: 智智强 普東西 | | | | | 大会日程 | | | 日期 | 时段 | 主会场 | 分会场 | | 6月26日 | 上午 | 高峰论坛 | 智算集群异构混训 技术研讨会 (闭门制) | | | 下午 | Al推理算力专题论坛 | 超节点技术研讨会 (闭门制) | | | | 智算 ...
Morgan Stanley--台积电2nm产能和wafer价格预估
傅里叶的猫· 2025-06-17 15:30
摩根士丹利在前天发布的一份研报中,对台积电展开了较为细致的剖析。不仅对台积电当前面临的各种 复杂情况的分析,还对2nm产能、wafer的价格都做出了预估。 在过去的三个月里,台积电的股价涨幅颇为可观,攀升了 31%。与之对比,中国台湾地区的加权指数 (TAIEX)同期涨幅为 27%,台积电的表现明显跑赢了大盘。不过,要是和英伟达相比,台积电就稍 显逊色了。在同一时期内,英伟达的股价一路飙升,涨幅高达 53%。摩根士丹利的分析师指出,造成 这一差距的部分原因在于外汇(FX)方面的压力,尤其是新台币(TWD)相对美元(USD)出现升值 的情况。新台币每升值 1%,台积电的毛利率就会下降 40 个基点。而近期新台币升值幅度达到了 8.1%,这使得台积电的毛利率受到了超过 3% 的负面影响。原本预计 2025 年下半年台积电的毛利率能 达到 58 - 59%,但如今这一预期已被调整至 55 - 56%。正是由于汇率导致的毛利侵蚀,分析师将台积电 2025 年和 2026 年的每股收益(EPS)预期分别下调了 6% 和 12%。尽管面临这样的困境,但考虑到人 工智能(AI)领域强劲的市场需求,以及台积电为抵消汇率影响而 ...
外资顶尖投行研报分享
傅里叶的猫· 2025-06-16 13:04
想要看外资研报的同学,给大家推荐一个星球,在星球中每天都会上传几百篇外资顶尖投行的原文研 报:大摩、小摩、UBS、高盛、Jefferies、HSBC、花旗、BARCLAYS 等。 还有专注于半导体行业分析的SemiAnalysis的全部分析报告: 现在星球中领券后只需要390元,即可每天都能看到上百篇外资顶尖投行科技行业的分析报告和每天的 精选报告,无论是我们自己做投资,还是对行业有更深入的研究,都是非常值得的。 ...
聊一聊目前主流的AI Networking方案
傅里叶的猫· 2025-06-16 13:04
2020 年初,一家领先 AI 公司的研究人员遇到了一个在几年前对任何网络工程师而言都荒谬的问 题:他们的旗舰语言模型(最终将为对话式 AI 系统提供动力的类型)训练了三周后,在完成 60% 时突然停滞。数百个 GPU 闲置在多个服务器机架中,消耗云资源的速度让首席财务官们心痛不已。 工程团队的第一反应是检查明显的问题所在:计算利用率?99%。内存使用情况?最佳。存储 I/O? 完全在限制范围内。然而训练过程实际上已冻结,GPU 在等待本应瞬间完成的任务。 事实证明,瓶颈并非数十年来定义计算性能的任何组件, 而是网络 。更具体地说,这个网络设计适 用于计算机偶尔相互通信的场景,而非数千个处理器需要完美同步协调每一次计算的场景。传统数 据中心网络栈(为响应用户请求的 Web 服务器、为应用提供服务的数据库和移动文件的存储系统而 构建)根本无法满足 AI 工作负载对集体通信模式的需求 —— 这是人类应用从未有过的需求。 这不仅是技术问题,更是将重塑整个行业的架构不匹配。AI 工作负载不仅需要更多网络资源,还需 要根本不同的网络架构。而这种差异正是一场竞争革命的种子:它将一个看似 unlikely 的参与者推 向主 ...
国外大厂的HBM需求分析
傅里叶的猫· 2025-06-15 15:50
根据Trendforce的数据,2024 年,整体 HBM 消耗量达 6.47B Gb、年增 237.2%,其中 NVIDIA、 AMD 的 GPU 分别占消耗量的 62%、9%,其他业者(主要为 CSP 业者的 ASIC 所需)占 29%,分产 品看 HBM2e、HBM3、HBM3e 贡献的消耗量成三足鼎立,尤以 HBM3e 8hi 及 HBM2e 8hi 最多; 2025 年,预估整体 HBM消耗量将达 16.97B Gb、年增 162.2%,较上季预估的 16.40B Gb 小幅上修, 因 NVIDIA 及 AWS 的 AI 芯片出货预估上修,其中 NVIDIA、AMD、Google、AWS、其他业者分别 占消耗量的 70%、7%、10%、8%、5%,分产品而言 HBM3e 为消耗量大宗,尤以 HBM3e 12hi 最 多。 NVIDIA NVIDIA 在 2024 年的 HBM 需求总量预计达到 6.47B Gb,占整个 AI 存储器市场的显著比例。这一 数字在近期有所调整,调整后的 HBM 总容量定为 6.55B Gb。NVIDIA 的 GPU 在 HBM 需求中占据 主导地位,贡献率大约在 62% ...
聊聊910D和920
傅里叶的猫· 2025-06-14 13:11
以下文章来源于AI半导体专研 ,作者专研 AI半导体专研 . AI与半导体行业研究分享 上一篇 910B和910C 2025年预计出货情况和客户分布 对910B和910C的情况做了详细解读,本篇还是基 于本营本周发布的两份纪要,来聊一聊910D和920的情况: 910D已基本确定为四个Die的设计。 与910C相⽐,主要调整包括由两个Die升级为四个Die;性能方面, 910D在单卡综合性能上,应该会超过H100。预计最乐观情况下明年第⼆季度,最晚2026年第⼆季度末 可以实现市场出货。 920与910⼀样会有多个版本,⾸个版本将直接 采⽤双Die设计,⼯艺也会优化。架构调整幅度最⼤,将 从现有架构全⾯转向 GPGPU架构,⽣态上也会与NVIDIA的⽣态进⾏互通, GPU服务器 我们目前也在跟国内的数据中心厂家合作,提供GPU租赁服务,有兴趣的朋友可以加微信: 知识星球 星球中每天都会更新上百篇科技行业外资投行的研报,有全部的SemiAnalysis的分析报告,还会不定期更 新Seeking Alpha、Substack、 stratechery的精选文章。 每天还会推送精选的外资投行/国内券商的优质研报,省 ...
英伟达特供中国的B20/B40 spec分析
傅里叶的猫· 2025-06-14 13:11
我们之前写过两篇关于英伟达特供中国阉割版H20的文章,都是基于外资投行的分析,这篇文章,我们 来看下substack上的一个分析,这个分析的内容比之前两篇的内容都要更加的详细。 原文链接:https://substack.com/home/post/p-165933497 Substack账户: Global Semi Research 本次转载已获原作者授权 正文 英伟达首席执行官黄仁勋周四在巴黎对CNN记者安娜·斯图尔特表示:"未来,我们的预测将不包括中国 市场。"然而,中国对英伟达的重要性不言而喻——否则,黄仁勋不会如此努力地放大华为作为竞争威 胁的形象。他声称华为的芯片可与英伟达最先进的处理器相媲美,但这与中国市场的实际情况不符。 我们的行业调查显示,华为的CloudMatrix384——黄仁勋将其定位为可与英伟达Blackwell架构媲美的产 品——在中国市场上难以推广。虽然一些公司表示了兴趣,但尚未有实质性订单。 B20使用英伟达的ConnectX-8实现互连功能,通过以太网实现连接,最大互连带宽为800Gbps。每块B20 芯片通过NVLink总线连接到ConnectX-8芯片,形成一个相当于P ...
稀土这张牌,中国还能打多久
傅里叶的猫· 2025-06-12 16:10
这两天中美高层在伦敦的谈判,皆因稀土而起。在中美关系愈发紧张的背景下,美国针对我们的出 口管制政策越来越重,而我们手里的底牌其实并不多,但稀土这张牌,就已经拿捏了欧美很多产业 的命脉,也迫使美国不得不跟我们重新谈判。 笔者在半年前就写过一篇稀土管制对美国的影响,当时的结论是,只要我们的管理措施有效,那美 国就必然被我们卡脖子。 中国限制稀有金属的出口,到底对美国影响多大? 历史背景与政策演变 稀土元素作为现代高科技产业的核心材料,其战略价值在全球经济中日益凸显。虽然叫"稀土",但 其实并不是稀有。实际上,稀土元素(如镧、铈、钕等17种元素)在地壳中的储量并不算特别稀 缺,有些甚至比常见金属如铜或锌更丰富。例如,铈的储量与铜相当,而钇的储量比铅还多。之所 以称为"稀土",主要是因为这些元素很少以高浓度、易开采的矿床形式存在,分散在其他矿物中, 开采和提炼过程复杂且成本高昂。 中国在稀土行业的统治地位可以追溯到20世纪80年代末和90年代初,当时中国通过大规模开采和低 成本出口,迅速占据了全球稀土市场约97%的份额。由于价格低廉,稀土甚至被形容为"卖出了白菜 价",这种低价策略虽然短期内促进了出口,但也带来了严重 ...
昇腾910系列全年出货量下调
傅里叶的猫· 2025-06-11 11:31
随着美国针对GPU的限制越来越多,大家对国产GPU尤其是华为昇腾系列GPU的表现和出货量都非 常关心,前段时间老黄还说华为芯片性能已超H200,华为的CloudMatrix云架构也已经超英伟达。当 然老黄这么说肯定是有夸张的成分,他一直对美国政府出台的这些限制政策很不爽,既让英伟达损 失了很多中国的大客户,又让国产GPU在这段时间取得了突飞猛进的发展。 由于华为从未对外公布过昇腾系列的出货量,因此我们只能参考第三方的调研,本文中关于昇腾910 系列出货量的数据,是参考自本营最近的一份调研纪要。 国产GPU采购情况 相信本文的读者们应该都看到过关于CSP大厂的资本开支,字节预计2025年投入1600亿,阿里宣布 未来3年投入3800亿建设云和AI硬件基础设施,腾讯预计2025投入900亿。根据公众号"AI半导体专 研"的一个调研,在H20被禁后,国内大厂对于国产GPU卡的态度和采购计划如下: 字节最为积极,主要采用寒武纪和昇腾,并广泛测试国内其他品牌,2025年计划增加采购这些品牌 的卡。 阿里则较为谨慎,除了自研的平头哥外,还上线了部分昇腾卡,但性能表现不佳;2025年预计首次 采购海光和寒武纪的卡,同时继续 ...