Workflow
低延迟推理
icon
Search documents
SemiAnalysis:GTC 2026深度解读,推理王国全面扩张
傅里叶的猫· 2026-03-24 08:33
关于GTC 2026的review网上也有很多资料了,但SemiAnalysis的这个应该是我看过的写的最详细 的,从Groq LPU架构、IP供应商的选择、FPGA供应商、FPGA的作用、FFN分离、Kyber机架、CP O、NVL576、Feynman、CMX,最后写到大家最关心的供应链,都写的非常细,文中我们也会顺带 聊一下今天比较火的一个新闻:MGX ETL机架兼容国内GPU? Groq 到底有什么价值? Groq 的核心产品是 LPU,专门为语言模型推理设计的处理器。和英伟达的 GPU 比起来,这两种芯 片走的是完全不同的路线。 LP35 是 LP30 的小改款,还是用 SF4 工艺,主要是加入了 NVFP4 数字格式的支持。但真正重要 的是 LP40,这将是第一款英伟达深度参与设计的 LPU。LP40 会转向台积电的 N3P 工艺,用 Co WoS-R 封装,支持 NVLink 协议而不是 Groq 原来的 C2C。还有个技术亮点是混合键合 DRAM, 在 SRAM 和传统 DRAM 之间提供一个中间选项,延迟和带宽比 SRAM 稍差,但比 DRAM 好很 多。SK 海力士会提供用于 3D 堆叠的 ...
重磅,英伟达将推中国版Groq芯片
半导体行业观察· 2026-03-17 23:39
据两名知情人士周二向路透社透露,英伟达正在准备推出一款面向中国市场的Groq人工智能芯 片。 英伟达去年底以 170 亿美元收购了人工智能芯片初创公司 Groq,并在本周于加州圣何塞举行的年 度开发者大会上展示了一系列基于其芯片的新产品。 英伟达首席执行官黄仁勋表示,在获得美国总统唐纳德·特朗普政府的出口许可证和中国客户的采 购订单后,该公司已重启其 H200 芯片(目前旗舰芯片的前身)的生产。与此同时,英伟达也开始 着手为中国市场开发芯片版本。 英伟达计划利用Groq的芯片进行推理,即人工智能系统回答问题、编写代码或为用户执行任务。 在本周英伟达展示的产品中,该公司计划将即将推出的Vera Rubin芯片(该芯片无法在中国销售) 与Groq芯片结合使用。 尽管英伟达在人工智能系统训练市场占据主导地位,但在推理市场却面临着更为激烈的竞争。包括 百度在内的多家中国人工智能巨头,已经生产出自己的推理芯片。 一位消息人士告诉路透社,准备销往中国的芯片并非降级版本,也不是专门为中国市场制造的。该 消息人士称,新版本可以适配其他系统,并补充说,Groq芯片预计将于5月上市。 英伟达终于承认为何斥资 200 亿美元收购 ...