Workflow
计算机行业周报:Qwen赶超Llama成为全球第一开源模型,DeepSeek发布数学推理模型
SINOLINK SECURITIES·2025-05-05 03:23

建议关注国内生成式大模型龙头科大讯飞;AI 硬件有望成为应用落地的新载体,建议关注萤石网络、虹软科技 等;AI 相关功能打磨能够带动 C 端应用月活量、付费率提升,建议关注金山办公、万兴科技等。 风险提示 本周观点 投资建议 行业竞争加剧的风险;技术研发进度不及预期的风险;特定行业下游资本开支周期性波动的风险。 敬请参阅最后一页特别声明 1 4 月 29 日,阿里 Qwen3 系列模型开源发布,包含两款 MoE 模型(235B/20B)以及六款密集模型 (0.6B/1.7B/4B/8B/14B/32B),其中旗舰模型 Qwen3-235B-A22B 与 DeepSeek-R1、o1、o3-mini、Grok-3 和 Gemini-2.5-Pro 等顶级模型表现相当。Qwen3 的部署成本还大幅下降,仅需 4 张 H20 即可部署满血版,显存 占用仅为性能相近模型的三分之一。阿里通义已开源了 200 余个模型,全球下载量超 3 亿次,Qwen 衍生模型 数超 10 万个,已超越 Llama,成为全球最大的开源模型族群。本周,DeepSeek-Prover-V2 发布,是一款专为 「数学 AI 编程语言」Lean ...