DeepSeek Prover

Search documents
对谈 DeepSeek-Prover 核心作者辛华剑:Multi Agent 天然适合形式化数学 |Best Minds
海外独角兽· 2025-06-12 13:27
嘉宾:辛华剑 访谈:penny Era of Experience 这篇文章中提到:如果要实现 AGI, 构建能完成复杂任务的通用 agent,必须借助"经验"这一媒介,这里的"经验"就是指强化学 习过程中模型和 agent 积累的、人类数据集中不存在的高质量数据。 强化学习是 AGI 的关键解法。从 OpenAI o1 到 DeepSeek R1,我们不断在看到强化学习的潜力:DeepMind AlphaProof 被认为是"经验时代"初露端 倪的一个例子,作为第一个在 IMO 获奖的 AI,AlphaProof 借助 RL 算法自行"做题",积累经验,AlphaProof 的案例表明,在像数学这样人类高水 平知识接近极限的领域,RL 通过互动试错可以突破瓶颈,取得超人类的成果。 以 AlphaProof 为开端,整个数学证明领域也在最近半年迎来了 AI 突破的密集期:除了 AlphaProof ,OpenAI 的 o1 模型在数学推理上展现出了惊 人表现,DeepSeek-Prover 三部曲也在形式化数学证明上不断创造新纪录。 为了理解数学和 AGI 的关系,海外独角兽访谈了 DeepSeek-Prov ...
形式化证明与大模型:共创可验证的AI数学未来|量子位直播
量子位· 2025-05-27 03:53
现在,AI完成自动定理证明的表现与挑战究竟如何?主流的技术路径是什么?AI完成形式化 证明的能力,又将对大模型应用带来怎样的影响? 为了回答这些问题, 5月29日20:00 ,我们与2077AI开源基金会共同邀请到了来自 DeepSeek Prover 、 FormalMath 、 Kinima 等项目团队的成员,一同来讨论 大语言模 型形式化证明前沿探索 。 点击下方按钮,一键预约直播 就在5月,前有 DeepSeek Prover V2 发布,后有 陶哲轩的AI数学直播 ,还有谷歌最新发 布的 AlphaEvolve 。 大模型"解数学题"的能力已经是衡量 AI「智能天花板」 的一种方式,正吸引着无数团队争 相挑战。 为了更好地评估AI完成数学推理的能力,近期发布的 FormalMATH基准测试 也备受关注。 林樾 发自 凹非寺 量子位|公众号 QbitAI 也欢迎你加入 量子位每日AI交流群 ,一起来畅聊AI吧~ 一键关注 点亮星标 本周四晚20:00,一起来聊聊 AI数学 吧~ 一键三连 「点赞」「转发」「小心心」 欢迎在评论区留下你的想法! — 完 — 量子位AI主题策划 正在征集中! 欢迎参与专题 ...
R2来之前,DeepSeek又放了个烟雾弹
虎嗅APP· 2025-05-15 13:03
AI卷起的财富风暴。 作者|宋思杭 编辑|苗正卿 头图|视觉中国 5月前后,DeepSeek的动作倒是频繁,却都不是大家期待的R2。不过,一系列前菜已经给R2做足 了铺垫。 5月14日,一篇DeepSeek V3论文,揭示了梁文峰是如何做到"极致降本"的。这篇论文也让业界得 以一窥这家以技术立身的公司,其"内功"究竟修炼到了何种火候。 以下文章来源于AGI接口 ,作者宋思杭 AGI接口 . 出品|虎嗅科技组 实际上,4月30日,DeepSeek还上了另一道"前菜"。 当时,DeepSeek Prover V2以671B的参数重磅亮相,要知道,DeepSeek上一次发布V2模型的时 候仅有7B。对于DeepSeek Prover V2,行业观察者们普遍认为,这是AI在辅助科学发现,特别是 挑战人类智力极限的数学领域迈出的重要一步。 而DeepSeek近期的系列动作,放置于当前AI大模型产业的宏观背景下,更耐人寻味。 与此前发布的V3技术报告不同,这篇论文详细阐述了DeepSeek如何做到在硬件资源的的"紧箍 咒"下,通过精妙的"软硬一体"协同设计,将成本效益这笔账算到极致。 (虎嗅注:DeepSeek-V3 仅 ...
R2来之前,DeepSeek又放了个烟雾弹
Hu Xiu· 2025-05-15 10:52
头图|视觉中国 5月前后,DeepSeek的动作倒是频繁,却都不是大家期待的R2。不过,一系列前菜已经给R2做足了铺 垫。 编辑|苗正卿 5月14日,一篇DeepSeek V3论文,揭示了梁文峰是如何做到"极致降本"的。这篇论文也让业界得以一窥 这家以技术立身的公司,其"内功"究竟修炼到了何种火候。 与此前发布的V3技术报告不同,这篇论文详细阐述了DeepSeek如何做到在硬件资源的的"紧箍咒"下, 通过精妙的"软硬一体"协同设计,将成本效益这笔账算到极致。(虎嗅注:DeepSeek-V3仅使用了2048 块英伟达H800 GPU) 出品|虎嗅科技组 作者|宋思杭 实际上,4月30日,DeepSeek还上了另一道"前菜"。 当时,DeepSeek Prover V2以671B的参数重磅亮相,要知道,DeepSeek上一次发布V2模型的时候仅有 7B。对于DeepSeek Prover V2,行业观察者们普遍认为,这是AI在辅助科学发现,特别是挑战人类智力 极限的数学领域迈出的重要一步。 而DeepSeek近期的系列动作,放置于当前AI大模型产业的宏观背景下,更耐人寻味。 一方面,我们看到的是头部厂商在模型参数 ...
算力盘中直线拉升,新易盛涨逾10%,云计算ETF(159890)半日收涨1.20%
Sou Hu Cai Jing· 2025-05-08 04:00
5月8日,算力硬件板块异动活跃,新易盛涨超10%带动板块上行,重仓该股的云计算ETF(159890)早 盘大涨1.20%,成交额超2500万元。 成份股方面,在新易盛带动下,东华软件、万兴科技涨逾9%,中 际旭创涨超8%,博思软件、数字政通、拓尔思、天下秀、卫宁健康、神州信息等股跟涨。 今日算力强 势反弹,一方面是大盘情绪的逐步好转,早盘三大股指悉数飘红、科技相对占优;另一方面,板块本身 累积较多积极催化。 首先基本面上看,在已经公布财报的Mag7中,有四家公司给出的营收预测要么与 华尔街预期大致一致,要么超出预期。国内方面,云计算ETF(159890)标的指数成份股一季度营收、 净利润均同比实现大增,显示算力基建增长强劲。 梳理算力上市公司财报,东方证券认为AI芯片与服 务器行业受益于AI行业的迅猛发展而呈现指标加速,此外,算力租赁服务企业订单的密集落地和预付 账款的增加,也预示着相关业务的落地指日可待,而IDC行业由于业务落地周期长,目前从行业整体而 言尚未看到财务数据变化但该机构对前景也较为乐观。 其次产业发展上看,近期多款大模型迭代亮 相,先是阿里通义千问发布Qwen3系列开源大模型,随后小米开源首个 ...
科创综指ETF(589770)连涨3日,科技成长风格正在回归?
Jin Rong Jie· 2025-05-07 01:27
近期TMT领涨市场,科创综指ETF(589770)连涨3日,5月6日涨超1.9%。 消息面上,近期国内大模型新品陆续发布。DeepSeek发布Prover-V2-671B,参数达6710亿,方便模型更 快、更省资源地训练和部署。阿里Qwen3系列大模型、小米首个推理大模型等上线面世,大模型性能和 应用场景正在不断拓展和细化。 国外方面,近期披露的美股科技巨头财报纷纷超预期,且继续加大AI方面的资本开支。Meta2025财年 第一财季营收与每股收益均大幅超出市场预期,全年资本开支从先前的600亿至650亿美元上调至640亿 至720亿美元;微软2025财年第三财季营收、净利润和每股收益全线超预期,其Azure云计算部门的收入 增长33%。 机构纷纷指出,看好科技板块的布局机会,后续科技成长风格或将回归。 兴业证券认为,随着内部财报陆续披露,以及外部关税扰动逐步过去,科技成长的布局时点已在逐步临 近。且科技板块在经历前期的显著调整后,已经到了一个性价比较高的区间。中期来看,科技板块作为 兼具景气优势和产业趋势催化的中长期逻辑或将再度占据上风。 科创综指ETF(589770)紧密跟踪科创综指,对科创板市值覆盖度高约 ...
云计算沪港深ETF(517390)大涨超4%,位居ETF涨幅榜前三
Xin Lang Cai Jing· 2025-05-06 06:47
截至2025年5月6日 14:25,中证沪港深云计算产业指数(931470)强势上涨2.74%,成分股天源迪科(300047)上涨20.00%,华胜天成(600410)上涨10.01%,润和 软件(300339)上涨9.01%,数据港(603881),中国软件国际(00354)等个股跟涨。云计算沪港深ETF(517390)上涨4.16%,位居ETF涨幅榜前三。最新价报1.13 元。拉长时间看,截至2025年4月30日,云计算沪港深ETF近2周累计上涨3.15%。流动性方面,云计算沪港深ETF盘中换手4.66%,成交1382.15万元。拉长时 间看,截至4月30日,云计算沪港深ETF近1月日均成交994.03万元。 截至4月30日,云计算沪港深ETF近3年净值上涨56.99%,指数股票型基金排名12/1742,居于前0.69%。从收益能力看,截至2025年4月30日,云计算沪港深 ETF自成立以来,最高单月回报为33.39%,最长连涨月数为6个月,最长连涨涨幅为66.14%,上涨月份平均收益率为9.82%,年盈利百分比为66.67%,历史 持有3年盈利概率为80.85%。截至2025年4月30日,云计算沪港深E ...
AI Agent:模型迭代方向?
2025-05-06 02:28
AI Agent:模型迭代方向?20250503 摘要 • AI 商业化进展缓慢,To B 端尤为明显,微软 Copilot 未达预期,OpenAI 产品仍以 chatbot 为主,未进入 agent 阶段。Agent 准确率受限于大模 型能力,工程化手段成为完善产品的重要途径。 • Deepseek Prover V2 版本为解决 agent 产品化问题提供新思路,其核 心作者已公开相关信息,并在 GitHub 上提供论文,为提升 agent 执行复 杂任务的准确率提供了新的方向。 • OpenAI 和 Anthropic 在 autonomous AI system 研究方面均有进展, Anthropic 在技术积累上更超前,其 ComputeUse 系统运行时间早于 OpenAI 相应产品至少一个季度,在 agent 产品化和模型能力方面 Anthropic 或更具优势。 • 大型科技公司通过技术研发和工程化手段推动大模型发展, Deepseek、OpenAI 和 Anthropic 专注于技术研发,其他公司则采用工 程化手段完善产品,共同促进下一代 AI 产品的发展。 • Chatbot 和 Agen ...
巴菲特年底退休,63岁高管接班,已囤2.5万亿现金;黄仁勋十年首涨基本工资;爱上ChatGPT,女子结婚20年后要离婚|AI周报
AI前线· 2025-05-04 04:28
整理 | 傅宇琪、褚杏娟 巴菲特宣布年底退休,63 岁高管将接班!用龙虾偷运芯片?英伟达怒怼 Anthropic 造谣;黄仁勋 2025 财年薪酬达 4990 万美元;消息称蚂蚁集团旗下蚂蚁国际计划在香港上市;腾讯重组混元大模型 研发体系;网友反馈哪吒 App"网络异常",无法使用车辆远程操控;女子爱上 ChatGPT,并决定与结 婚 20 年丈夫离婚;全球首个"人工智能妈祖"亮相马来西亚,可解答信徒疑惑;阿里千问 3 登顶全球 最强开源模型;DeepSeek 发布 Prover-V2 模型,参数量达 6710 亿…… 行业热点 巴菲特宣布年底退休,63 岁高管将接班!已囤积 2.5 万亿元现金 当地时间 5 月 3 日,在 2025 年伯克希尔哈撒韦股东大会会议末尾,公司董事长兼 CEO 沃伦・巴菲 特宣布,在接下来的董事会上将提名现任副董事长格雷格・阿贝尔(Greg Abel)在年底接棒成为 CEO。他还宣布计划在年底退休。 巴菲特表示,他接下来仍会留在公司并提供帮助,但"最终决定权"将属于阿贝尔。他称赞阿贝尔将是 一个非常棒的 CEO,现在伯克希尔公司将会慢慢进入权力转移的工作。同时,巴菲特承诺自己"绝 ...