Deepseek新模型有望2月发布,这些方向成潜在发酵重点
Xuan Gu Bao·2026-01-15 08:19
据The Information报道,DeepSeek或将于2月发布新一代旗舰AI模型DeepSeek V4。 V4是DeepSeek继2024年12月发布的V3模型之后的最新版本。两位知情人士称,DeepSeek内部的初步测试表明,V4在编程能力上超过了目前市场上的其他顶 级模型,如Anthropic的Claude和OpenAI的GPT系列。 一、事件:DeepSeek V4发布 新模型或颠覆存储需求结构 尽管DeepSeek V4尚未正式发布,但从1月12日晚间DeepSeek发布梁文锋署名的新论文以及相关技术资料来看,其核心竞争力或来源于两项关键技术创新, 一举打破了传统大模型"参数即性能"的固有认知。 其中,论文中提到的Engram模块是V4架构的核心突破。据介绍,DeepSeek推出的Engram模块是一个巨大的、可扩展的嵌入表(Embedding Table)。 通俗地说,Engram就是给Transformer加个外接记忆库,并把当前token附近的一小段内容,用快速、省参数的方式,在一个超大的静态记忆表里查到对应内 容。 传统大模型需要通过全参数计算,同时完成知识存储与逻辑推理两大任务,造成了 ...