Workflow
DeepSeek,新版本
Zhong Guo Zheng Quan Bao·2025-09-29 12:39

9月29日,DeepSeek发布DeepSeek-V3.2-Exp模型版本。据介绍,这是一个实验性(Experimental)版 本,在此前版本V3.1-Terminus的基础上引入DeepSeek Sparse Attention(一种稀疏注意力机制),针对 长文本的训练和推理效率进行探索性的优化和验证。目前,DeepSeek的App、网页端、小程序均已同步 更新为DeepSeek-V3.2-Exp。同时,得益于新模型服务成本的大幅降低,API价格也相应下调。在新的价 格政策下,开发者调用DeepSeek API的成本将降低50%以上。 寒武纪表示,公司一直高度重视大模型软件生态建设,支持以DeepSeek为代表的所有主流开源大模 型。借助于长期活跃的生态建设和技术积累,寒武纪得以快速实现对DeepSeek-V3.2-Exp这一全新实验 性模型架构的day 0适配和优化。此前,公司对DeepSeek系列模型进行深入的软硬件协同性能优化,达 成了业界领先的算力利用率水平。针对本次的DeepSeek-V3.2-Exp新模型架构,寒武纪通过Triton算子开 发实现快速适配,利用BangC融合算子开发实现极致性能 ...