Workflow
Engram(条件记忆)模块
icon
Search documents
DeepSeek V4诞生前夜?梁文锋署名新论文发布
华尔街见闻· 2026-01-13 11:01
DeepSeek计划在2月春节前后正式发布V4,而这一刻或许就是DeepSeek V4诞生的前夜。 这是一场关于AI"大脑皮层"的重构。 长期以来,Transformer架构被困在一个昂贵的悖论中:我们用着最先进的GPU算力,去让AI模型"死记硬背"那些查字典就能知道的静态知识。 DeepSeek梁文锋团队与其北大合作者在今日凌晨发布的重磅论文《Conditional Memory via Scalable Lookup》,彻底打破了这一僵局。他们提出了一种全新 的 Engram(印迹)模块 ,在传统的"条件计算"(MoE)之外,开辟了第二条稀疏化战线—— "条件记忆" 。 这不只是一次技术修补,而是一场关于模型"脑容量"的供给侧改革。它证明了: 当我们将"记忆"从"计算"中剥离,把该背的交给"字典",把该算的交给大脑, AI的推理能力将迎来反直觉的爆发式增长。 六层神经网络的"无用功" 故事的起点,源于DeepSeek团队对Transformer内部运作机制的一次"核磁共振"扫描。 在人工智能的黑盒子里,当大模型看到"Diana, Princess of Wales"(戴安娜,威尔士王妃)这个短语时,它的内 ...