ProverBench

Search documents
计算机行业重大事项点评:DeepSeek-Prover-V2发布,专注数学推理
Huachuang Securities· 2025-05-04 09:28
证 券 研 究 报 告 计算机行业重大事项点评 DeepSeek-Prover-V2 发布,专注数学推理 事项: 4 月 30 日,DeepSeek 在 Hugging Face 发布了 DeepSeek-Prover-V2-671B 新模 型和 DeepSeek-Prover-V2-7B 增强模型,以及 DeepSeek-ProverBench 数据集, 随后在 GitHub 等平台上公布了论文信息。 评论: 行业研究 计算机 2025 年 05 月 04 日 推荐(维持) 华创证券研究所 证券分析师:吴鸣远 邮箱:wumingyuan@hcyjs.com 执业编号:S0360523040001 证券分析师:祝小茜 邮箱:zhuxiaoqian@hcyjs.com 执业编号:S0360524070011 行业基本数据 | | | 占比% | | --- | --- | --- | | 股票家数(只) | 336 | 0.04 | | 总市值(亿元) | 42,657.40 | 4.41 | | 流通市值(亿元) | 36,398.85 | 4.74 | 相对指数表现 | % | 1M | 6M | 12M ...
DeepSeek开源Prover-V2强推理模型,网友:奥数从没这么简单过
机器之心· 2025-05-01 02:11
机器之心报道 编辑:大盘鸡、泽南 DeepSeek R2 的前奏? 五一劳动节到了,DeepSeek 的新消息可没停下来。 前些天到处都在流传着 DeepSeek-R2 即将发布的传言,DeepSeek 确实有新动作,不过大家没等来 R2,等来的是 DeepSeek-Prover-V2,它当然也是 开源的。 Prover-V2 在定理证明赛道上实现了业内最佳性能,在 MiniF2F 测试中达到了 88.9% 的通过率,在 AIME 24、25 上也有不错的分数。 在 4 月 30 日晚,机器学习协作平台 HuggingFace 上就更新了 DeepSeek-Prover-V2 的一些技术细节。 | Models | | --- | 其中,DeepSeek-Prover-V2-671B 是在 DeepSeek-V3-Base 基础上训练而成,而 DeepSeek-Prover-V2-7B 则基于 DeepSeek-Prover-V1.5- Base 构建,并支持最长 32K tokens 的上下文长度扩展。 要一句话总结 DeepSeek-Prover-V2 到底是什么? 它是一款专为「数学 AI 编程语言」L ...
DeepSeek开源新模型,数学推理能力大提升
Hu Xiu· 2025-05-01 00:48
赶在五一假期前夕,DeepSeek给我们送出一份惊喜大礼。 延续一贯的开源节奏,DeepSeek在Hugging Face正式发布DeepSeek-Prover-V2,并同步上线模型卡及示例代码。此次共推出两个版本: *核心贡献者†在DeepSeek-AI实习期间完成的工作 据官方论文披露,DeepSeek-Prover-V2的训练核心是"递归+强化学习"的组合:即先由DeepSeek-V3拆解复杂定理,生成一系列子目标和推理思路;再通过 GRPO算法,从多种候选方案中自动学习如何选出最优解。 模型特别引入了两种互补的"解题风格": DeepSeek-Prover-V2-7B:基于上一代V1.5模型,支持最长32K上下文输入; DeepSeek-Prover-V2-671B:在DeepSeek-V3-Base基础上训练,推理性能最强。 训练过程分为两阶段,在第一阶段,研究人员主要训练快速模式,采用"专家迭代"方法:模型先尝试解决难题,成功的答案再作为新数据反哺模型,不断 打磨自己的能力。 待快速模式趋于稳定后,研究人员进入第二阶段,开始训练更复杂的逻辑推理能力。他们将DeepSeek-V3的数学知识迁移到新模 ...