Workflow
DeepSeek-V3.1正式发布,叫板OpenAI,适配下一代国产芯片

摘要: 在商业与生态层面,DeepSeek 选择了"双轨"策略,一方面继续提供 API 服务,但将于9月6日起调整价格并取消夜间优惠;另一方面,V3.1的Base模型与 后训练版本已在Hugging Face和魔搭同步开源。 值得一提的是,在这一次的官方发布说明中,DeepSeek提到"V3.1使用了 UE8M0 FP8 Scale的参数精度",更为通俗的说,它设置了一个适配于即将发布的 新一代国产芯片的技术规范与设计标准。"建议有部署需求的用户仔细阅读新版说明文档。"而在此之前,国产芯片部署DeepSeek通常会有一定性能减弱, 除非再做专门的软件适配。 配合128K的上下文扩展和FP8精度推理,V3.1在工程层面强化了吞吐效率与能耗表现,为大规模应用打下基础。 除了推理效率上的改进,V3.1在智能体能力上的进化尤为关键。官方测试显示,在代码修复和命令行任务等编程智能体场景中,新模型展现出更强的执行 力和稳定性,能够在真实环境中完成多轮迭代修正,避免"越改越乱"的问题。 在复杂搜索任务上,V3.1则展现了更成熟的检索与整合能力,它可以规划搜索步骤、筛选证据并综合多源信息,在高难度的多学科题目测试中,性能已经 ...