DeepSeekEngram:把“回忆”交给查表,把算力留给推理

wo[Table_Title] Research Report 27 Jan 2026 中国电子 China (Overseas) Technology DeepSeek Engram:把"回忆"交给查表,把算力留给推理 DeepSeek Engram: Delegate Recall to Lookups, Reserve Compute for Reasoning 姚书桥 Barney Yao 吕小潼 Xiaotong Lyu barney.sq.yao@htisec.com xt.lyu@htisec.com [Table_header1] 中国电子 AI 基础设施"瓶颈位置"可能从 HBM 进一步外溢到 DRAM/互联/存储。Engram 的系统层设计通过其确定性寻址机制,实 现了在 GPU 进行计算的同时对主机内存进行数据预取,从而将海量静态参数从昂贵的高带宽内存(HBM/显存)中剥 离,显著缓解了显存容量压力。论文的定性结论指出,即使将规模达 100B 的记忆参数表卸载至主机内存,其带来的额 外推理开销也可控制在 3%以内。从基础设施成本结构的视角分析,我们认为该技术路径的影响可能主要体现在以下三 ...