Workflow
国君计算机|国产大模型性能领先,场景应用加速落地
国泰君安·2025-01-02 08:03

投资建议:DeepSeek-V3的发布标志着国产AI在规模、效率和成本方面实现重大突破。DeepSeek-V3在多项 评测中超越多款顶尖模型,且成本极具竞争力。因此AI大模型在各行业落地的技术路径有望逐步明确,MoE架构的 低成本、高性能的大模型在垂类领域中的运用潜力巨大。 DeepSeek-V3的强大性能与开源策略显著提升了其市场竞争力,具备高投资价值。DeepSeek正式发布了其全 新系列模型DeepSeek-V3,并同步开源。该模型为自主研发的MoE架构,拥有6710亿参数和37亿激活参数,在 14.8万亿token上进行了预训练。DeepSeek-V3在多个评测中超越了Qwen2.5-72B和Llama-3.1-405B等开 源模型,其性能与顶尖闭源模型GPT-4o和Claude-3.5-Sonnet相媲美。尤其在知识类任务、长文本处理、代码 编写和数学竞赛等方面表现出色。 DeepSeek-V3的生成速度提升和灵活的API定价策略为用户带来更高的使用价值。通过算法和工程上的创新, DeepSeek-V3的生成吐字速度从每秒20次提升至60次,实现了3倍的性能提升,用户体验更加流畅。 DeepSeek ...