推理上下文内存平台(ICMS)
Search documents
开启存储下一个大机会!韩媒详解黄仁勋“神秘推理上下文内存平台”
Hua Er Jie Jian Wen· 2026-01-25 05:28
在1月5日的2026年国际消费电子展(CES)上,英伟达首席执行官黄仁勋发布了名为"推理上下文内存平台"(ICMS)的全新硬件,旨在解决人工智能 推理阶段爆炸式增长的数据存储需求。此举标志着AI硬件架构的重心正从单纯的算力堆叠向高效的上下文存储转移,NAND闪存和SSD有望接棒 HBM,成为下一个关键的增长引擎。 《韩国经济日报》在1月24日的文章中介绍,黄仁勋在演讲中展示了一个被称为"推理上下文内存平台"(Inference Context Memory Platform,简称 ICMS)的神秘黑色机架。这并非普通的硬件更新,而是一个旨在解决人工智能推理阶段数据瓶颈的关键创新。记者敏锐地捕捉到,这可能是继HBM (高带宽内存)之后,存储行业的下一个爆发点。 这一平台的核心逻辑在于解决AI推理中的"KV缓存"(键值缓存)问题。随着AI从单纯的学习阶段转向大规模推理应用,数据量呈爆炸式增长,现有的 GPU显存和服务器内存架构已难以满足需求。英伟达通过引入全新的数据处理单元(DPU)和海量SSD(固态硬盘),构建了一个庞大的缓存池,试图 打破这一物理限制。 英伟达将该平台定位为介于服务器内部本地SSD和外部存储之 ...