Workflow
Certified AI
icon
Search documents
对谈 DeepSeek-Prover 核心作者辛华剑:Multi Agent 天然适合形式化数学 |Best Minds
海外独角兽· 2025-06-12 13:27
嘉宾:辛华剑 访谈:penny Era of Experience 这篇文章中提到:如果要实现 AGI, 构建能完成复杂任务的通用 agent,必须借助"经验"这一媒介,这里的"经验"就是指强化学 习过程中模型和 agent 积累的、人类数据集中不存在的高质量数据。 强化学习是 AGI 的关键解法。从 OpenAI o1 到 DeepSeek R1,我们不断在看到强化学习的潜力:DeepMind AlphaProof 被认为是"经验时代"初露端 倪的一个例子,作为第一个在 IMO 获奖的 AI,AlphaProof 借助 RL 算法自行"做题",积累经验,AlphaProof 的案例表明,在像数学这样人类高水 平知识接近极限的领域,RL 通过互动试错可以突破瓶颈,取得超人类的成果。 以 AlphaProof 为开端,整个数学证明领域也在最近半年迎来了 AI 突破的密集期:除了 AlphaProof ,OpenAI 的 o1 模型在数学推理上展现出了惊 人表现,DeepSeek-Prover 三部曲也在形式化数学证明上不断创造新纪录。 为了理解数学和 AGI 的关系,海外独角兽访谈了 DeepSeek-Prov ...
当AI遇上数学:大语言模型如何掀起一场形式化数学的革命? | Deep Talk
锦秋集· 2025-05-12 09:13
随着大语言模型在内容创作、代码生成与科学问答等领域掀起巨大变革浪潮,以严谨逻辑与精密结构著称的数学领域也迎来了深刻的转型契机。 当前,数学理论的复杂性不断提升,许多重要定理的证明规模已远超传统人工审阅的能力边界。动辄数百页的证明不仅挑战了同行评审的极限,更暴露出人工验证 过程的缓慢与脆弱性。针对这一困境,形式化数学方法开始成为重要的解决路径。这一方法通过将数学命题严格表达为形式逻辑语言,并借助计算机进行自动化验 证,有效地提升了定理证明的准确性和可靠性。 在形式化数学日益成为趋势的背景下,来自爱丁堡大学的博士研究生辛华剑自2022年起致力于将大语言模型技术与形式化数学方法结合,曾分别在DeepSeek和字节 跳动Seed团队进行相关研究。 2025年5月9日,辛华剑在由剑桥中国AI协会、锦秋基金、清华大学学生通用人工智能协会、 清华大学学生创业协会联合举办的主题分享会上,以《大语言模型时代 的形式化数学革命》为题,详细阐述了形式化数学的历史演进、现状挑战以及未来发展方向。 他认为: 以下内容为此次报告的整理与深化,经由分享人本人审阅补充。 引言 当大语言模型(LLM)以空前规模席卷内容创作与科学研究等领域之际 ...