Workflow
中信证券:DeepSeek V3发布,加速AI应用落地
600030CITIC Securities Co., Ltd.(600030) 财联社·2024-12-30 00:42

中信证券认为,DeepSeek新一代模型的发布意味着AI大模型的应用将逐步走向普惠,助力AI应用广泛 落地;同时训练效率大幅提升,亦将助力推理算力需求高增。持续看好AI产业链的加速落地机遇,建 议重点关注AI应用、AI Infra、AI算力三大主线。 12月26日,DeepSeek-V3(深度求索)首个版本正式发布并同步开源,已在网页端和API全面上线。其 在训练效率和推理速度上相较历史模型有了大幅提升,同时可保证领先的模型能力表现,引起业内高度 关注。 参考官方论文,DeepSeek v3为6710亿参数MoE架构模型,激活37B,在14.8T token上进行了预训练。能 力上,模型暂不支持多模态输入,但在通识和专业知识测试集上表现优秀,MMLU pro正确率75.9%, GPQA-Diamond正确率59.1%,达到国内第一梯队,接近Claude 3.5 Sonnet的水平;并且在数学和代码领 域测试表现突出,MATH 500正确率90.2%,SWE-bench正确率42.0%,Codeforces得分51.6,超越所有非 o系列模型。模型生成速度达到60TPS,是前代模型的三倍。定价上,API定价为输 ...