Workflow
DeepSeek V3.1 Base突袭上线,击败Claude 4编程爆表,全网在蹲R2和V4
Seek .Seek .(US:SKLTY) 3 6 Ke·2025-08-20 03:52

就在昨晚,DeepSeek官方悄然上线了全新的V3.1版本,上下文长度拓展到128k。 对于这波更新,大家的热情可谓是相当高涨。 即便还未公布模型卡,DeepSeek V3.1就已经在Hugging Face的趋势榜上排到了第四。 本次开源的V3.1模型拥有685B参数,支持多种精度格式,从BF16到FP8。 综合公开信息和国内大咖karminski3的实测,V3.1此次更新亮点有: 编程能力:表现突出,根据社区使用Aider测试数据,V3.1在开源模型中霸榜。 性能突破:V3.1在Aider编程基准测试中取得71.6%高分,超越Claude Opus 4,同时推理和响应速度更快。 原生搜索:新增了原生「search token」的支持,这意味着搜索的支持更好。 架构创新:线上模型去除「R1」标识,分析称DeepSeek未来有望采用「混合架构」。 成本优势:每次完整编程任务仅需1.01美元,成本仅为专有系统的六十分之一。 值得一提的是,官方群中强调拓展至128K上下文,此前V3版本就已经支持。 | Model | #Total | #Activated | Context | Download | | --- ...