AlphaGeometry

Search documents
陶哲轩转发!DeepMind开源「AI数学证明标准习题集」
量子位· 2025-05-31 03:34
闻乐 发自 凹非寺 量子位 | 公众号 QbitAI 陶哲轩转发,AI搞数学证明的标准习题集来了! DeepMind最新开源 形式化数学猜想库 —— 猜想库收录了经典的形式化表述的数学猜想集合,例如,解析数论中的四个朗道问题。 不仅如此,资源库中还提供了各种代码函数,以方便用户对自然语言的数学猜想进行形式化的表述。 DeepMind的形式化数学猜想库一经建成,团队就表示所有人都可以将数学猜想添加到资源库中,呼吁大家积极参与。 感兴趣的数学家们可以行动起来了。 陶哲轩曾用Lean形式化证明了PFR猜想(多项式Freiman-Ruzsa猜想),这项成就的第一步就是将猜想的核心概念转化为计算机可验证的形 式化版本。 目前,这位"数学界的计算机推广大神"已转发此项目,并表示: "如果希望利用自动化工具帮助开放性问题,那么对这些问题进行形式化表述是重要的第一步。" 形式化数学猜想库有什么用 虽然带证明的形式化定理语料库不断扩充,但仅陈述开放式猜想的形式化资源却十分稀缺。 这类资源有望成为自动定理证明或形式化工具的测试基准,来帮助AI模型提升数学推理及证明能力。 DeepMind此次开源的猜想库在一定程度上缓解了这个问题 ...
清华学霸与AI比做高考压轴题,谁会赢?
Di Yi Cai Jing· 2025-05-27 11:17
姚班学生在10分钟内完成了作答,仅有1位同学做错了题目,AI答疑笔则在输入确认后几秒就开始输出步骤。 去年,"9.11和9.9谁大?"这一简单的数学题曾难倒了多家大模型。到了今年,大模型的理科能力提升如何? 今日网易有道发布了一则视频,6位清华姚班学生与AI比赛做高考压轴题。清华姚班为图灵奖得主姚期智院士创办,汇聚了数学、物理、信息学竞赛金牌得 主。 姚班学生和AI竞速的两道题分别为2023年高考数学全国一卷压轴题和2021年高考物理江苏卷压轴题。姚班学生在10分钟内完成了作答,仅有1位同学做错了 题目,AI答疑笔则在输入确认后几秒就开始输出步骤,并答对了题目。 对于AI的回答,一位姚班学生认为AI做题思路与其一致,步骤更加清晰,相较于传统的答案更有利于学生理解解题思路。 ## 1 Introduction The _Front_ of the Universe is a very important tool in the study of the evolution of the Universe. The Universe is a very rich and rich and rich and ric ...
技术伦理的断裂带:当AI信任超越人类控制
Hu Xiu· 2025-05-10 10:55
铜陵高速公路的监控画面定格在22时44分28秒——小米SU7以97公里时速撞向水泥护栏的瞬间,车内三 名大学生的生命与智能驾驶系统的决策算法一同化为燃烧的铁壳。 这场事故不仅撕开了智能汽车安全性的技术面纱,更暴露出一个残酷现实:已然证明可以对克隆人技术 实施严密有效监管、航空业一致保持高度监管从而有效降低事故率的人类,在面对人工智能的伦理框架 构建和人工智能创新时,却表现出令人费解的滞后与激进。这道不断扩大的鸿沟,正悄然将人类的生命 以及文明推向未知的风险深渊。 一、智能驾驶事故背后的"标准套利"与监管时差 小米事故车SU7标准版为降低成本移除激光雷达,而纯视觉系统在车速超过85km/h时的有效检测距离不 足200米,留给系统应急反应的时间仅在7秒左右,低于行业建议的安全阈值。面对这样的事故,我们不 禁要问:难道智能汽车行业没有成熟的安全标准可循吗? 事实上,百年航空业的发展为高风险行业提供了极为宝贵的安全体系参考。以波音787为例,该机型的 飞控系统需通过FAA 25部规章下超过300项专项认证,而且根据波音官方《787 Flight Crew Training Manual》数据,飞行员转型培训标准为28 ...