AI泡沫?
证券研究报告 | 行业周报 gszqdatemark 2025 11 30 年 月 日 计算机 AI 泡沫? 算法还在革新,DeepSeekMath-V2 发布。1)11 月 27 日 DeepSeek 推 出新型数学推理模型 DeepSeekMath-V2,采用可自我验证的训练框架。该 模型基于 DeepSeek-V3.2-Exp-Base 构建,通过 LLM 验证器自动审查生成 的数学证明,并利用高难度样本持续优化性能。在 IMO 2025 和 CMO 2024 中均达到金牌水平,Putnam 2024 获 118/120 分。为了实现可自验证的数 学推理,DeepSeek 研究了如何训练一个准确且忠实的基于大型语言模型 的定理证明验证器。然后 DeepSeek 以验证器为奖励模型训练一个证明生 成器,并激励生成器在最终定稿前尽可能多地识别和解决自身证明中的问 题。2)谷歌发布的 Gemini 3 Pro 则证明了高质量训练数据对提高模型能 力的重要作用,预训练数据集是一个大规模、多样化的数据集合,涵盖了 广泛的领域和模态,后训练数据集包括不同类型的指令微调数据、强化学 习数据和人类偏好数据。Gemini ...