DeepSeek Prover V2

Search documents
形式化证明与大模型:共创可验证的AI数学未来|量子位直播
量子位· 2025-05-27 03:53
现在,AI完成自动定理证明的表现与挑战究竟如何?主流的技术路径是什么?AI完成形式化 证明的能力,又将对大模型应用带来怎样的影响? 为了回答这些问题, 5月29日20:00 ,我们与2077AI开源基金会共同邀请到了来自 DeepSeek Prover 、 FormalMath 、 Kinima 等项目团队的成员,一同来讨论 大语言模 型形式化证明前沿探索 。 点击下方按钮,一键预约直播 就在5月,前有 DeepSeek Prover V2 发布,后有 陶哲轩的AI数学直播 ,还有谷歌最新发 布的 AlphaEvolve 。 大模型"解数学题"的能力已经是衡量 AI「智能天花板」 的一种方式,正吸引着无数团队争 相挑战。 为了更好地评估AI完成数学推理的能力,近期发布的 FormalMATH基准测试 也备受关注。 林樾 发自 凹非寺 量子位|公众号 QbitAI 也欢迎你加入 量子位每日AI交流群 ,一起来畅聊AI吧~ 一键关注 点亮星标 本周四晚20:00,一起来聊聊 AI数学 吧~ 一键三连 「点赞」「转发」「小心心」 欢迎在评论区留下你的想法! — 完 — 量子位AI主题策划 正在征集中! 欢迎参与专题 ...
R2来之前,DeepSeek又放了个烟雾弹
虎嗅APP· 2025-05-15 13:03
AI卷起的财富风暴。 作者|宋思杭 编辑|苗正卿 头图|视觉中国 5月前后,DeepSeek的动作倒是频繁,却都不是大家期待的R2。不过,一系列前菜已经给R2做足 了铺垫。 5月14日,一篇DeepSeek V3论文,揭示了梁文峰是如何做到"极致降本"的。这篇论文也让业界得 以一窥这家以技术立身的公司,其"内功"究竟修炼到了何种火候。 以下文章来源于AGI接口 ,作者宋思杭 AGI接口 . 出品|虎嗅科技组 实际上,4月30日,DeepSeek还上了另一道"前菜"。 当时,DeepSeek Prover V2以671B的参数重磅亮相,要知道,DeepSeek上一次发布V2模型的时 候仅有7B。对于DeepSeek Prover V2,行业观察者们普遍认为,这是AI在辅助科学发现,特别是 挑战人类智力极限的数学领域迈出的重要一步。 而DeepSeek近期的系列动作,放置于当前AI大模型产业的宏观背景下,更耐人寻味。 与此前发布的V3技术报告不同,这篇论文详细阐述了DeepSeek如何做到在硬件资源的的"紧箍 咒"下,通过精妙的"软硬一体"协同设计,将成本效益这笔账算到极致。 (虎嗅注:DeepSeek-V3 仅 ...
R2来之前,DeepSeek又放了个烟雾弹
Hu Xiu· 2025-05-15 10:52
头图|视觉中国 5月前后,DeepSeek的动作倒是频繁,却都不是大家期待的R2。不过,一系列前菜已经给R2做足了铺 垫。 编辑|苗正卿 5月14日,一篇DeepSeek V3论文,揭示了梁文峰是如何做到"极致降本"的。这篇论文也让业界得以一窥 这家以技术立身的公司,其"内功"究竟修炼到了何种火候。 与此前发布的V3技术报告不同,这篇论文详细阐述了DeepSeek如何做到在硬件资源的的"紧箍咒"下, 通过精妙的"软硬一体"协同设计,将成本效益这笔账算到极致。(虎嗅注:DeepSeek-V3仅使用了2048 块英伟达H800 GPU) 出品|虎嗅科技组 作者|宋思杭 实际上,4月30日,DeepSeek还上了另一道"前菜"。 当时,DeepSeek Prover V2以671B的参数重磅亮相,要知道,DeepSeek上一次发布V2模型的时候仅有 7B。对于DeepSeek Prover V2,行业观察者们普遍认为,这是AI在辅助科学发现,特别是挑战人类智力 极限的数学领域迈出的重要一步。 而DeepSeek近期的系列动作,放置于当前AI大模型产业的宏观背景下,更耐人寻味。 一方面,我们看到的是头部厂商在模型参数 ...
AI Agent:模型迭代方向?
2025-05-06 02:28
AI Agent:模型迭代方向?20250503 摘要 • AI 商业化进展缓慢,To B 端尤为明显,微软 Copilot 未达预期,OpenAI 产品仍以 chatbot 为主,未进入 agent 阶段。Agent 准确率受限于大模 型能力,工程化手段成为完善产品的重要途径。 • Deepseek Prover V2 版本为解决 agent 产品化问题提供新思路,其核 心作者已公开相关信息,并在 GitHub 上提供论文,为提升 agent 执行复 杂任务的准确率提供了新的方向。 • OpenAI 和 Anthropic 在 autonomous AI system 研究方面均有进展, Anthropic 在技术积累上更超前,其 ComputeUse 系统运行时间早于 OpenAI 相应产品至少一个季度,在 agent 产品化和模型能力方面 Anthropic 或更具优势。 • 大型科技公司通过技术研发和工程化手段推动大模型发展, Deepseek、OpenAI 和 Anthropic 专注于技术研发,其他公司则采用工 程化手段完善产品,共同促进下一代 AI 产品的发展。 • Chatbot 和 Agen ...