从英伟达整合Groq看近存计算新路径
从英伟达整合 Groq 看近存计算新路径 20251228 摘要 Groq 的 LPU 架构专为推理设计,拥有低延时、确定性执行时间、高用 户并发和超高带宽等优势,尤其在处理大语言模型时表现突出,但其场 景专用性强,编程难度高,部署成本也较高。 英伟达收购 Groq 后,将保持 CUDA 生态系统的通用性,并通过 NVFusion 快速集成 LPU,长期目标是在底层架构和编译器层面实现协 同设计,以满足推理场景下的高性能需求,推动推理芯片架构的多样化 发展。 国内 3D DM 方案在容量上优于 SRAM,带宽接近 SRAM 并优于 HBM, 但在成熟度方面仍需 2-3 年才能实现规模化部署,良率和散热是限制其 落地的重要瓶颈。 云天励飞等国内企业正积极研发 3D 芯片,目标是实现 TCO 的显著降低, 尤其是在单 Token 成本上,以满足市场对低成本、高性能推理解决方案 的需求。 凯霞开发的高堆叠氧化物半导体沟道晶体管支持高密度 3D DRAM,对 国内市场具有重要意义,将推动国内相关技术的发展和应用,加速 3D 芯片技术的创新。 Q&A 英伟达收购 Groq 的背景和意义是什么? 英伟达耗资 200 亿美 ...