Workflow
DeepSeek新版本API价格下调 寒武纪:对新模型DeepSeek

寒武纪表示,公司一直高度重视大模型软件生态建设,支持以DeepSeek为代表的所有主流开源大模 型。借助于长期活跃的生态建设和技术积累,寒武纪得以快速实现对DeepSeek-V3.2-Exp这一全新实验 性模型架构的day 0适配和优化。此前,公司对DeepSeek系列模型进行深入的软硬件协同性能优化,达 成了业界领先的算力利用率水平。针对本次的DeepSeek-V3.2-Exp新模型架构,寒武纪通过Triton算子开 发实现快速适配,利用BangC融合算子开发实现极致性能优化,并基于计算与通信的并行策略,再次达 成业界领先的计算效率水平。 "华为计算"公众号发文称,昇腾已快速基于vLLM/SGLang等推理框架完成适配部署,实现DeepSeek- V3.2-Exp 0day支持,并面向开发者开源所有推理代码和算子实现。华为昇腾在DeepSeek-V3.2-Exp一发 布开源即实现DeepSeek-V3.2-Exp BF16模型部署,并在CANN平台上完成对应的优化适配,整体部署策 略沿用DeepSeek的大EP并行方案,针对稀疏DSA结构,叠加实现长序列亲和的CP并行策略,兼顾时延 和吞吐,在128K长序列 ...