AlphaEvolve

Search documents
AI成为数学家得力助手还要多久
Ke Ji Ri Bao· 2025-06-17 01:18
为了打破这一局面,美国国防高级研究计划局今年4月启动了"指数性数学"计划,旨在开发一种能 极大提升数学研究效率的人工智能(AI)"合著者"系统。 几十年来,数学家借助计算机进行辅助计算或验证命题,如今的AI或许能更上层楼,挑战那些人 类长年未解的难题。不过,从能解高中题的AI,到能协助攻克前沿数学难关的AI,中间仍隔着一道鸿 沟。 解决重大难题仍力不从心 大型语言模型(LLM)并不擅长数学。它们常常出现"幻觉",甚至可能被误导相信2+2=5。但新一 代大型推理模型,如OpenAI的o3、Anthropic的Claude 4 Thinking等,展现出的进步令数学家眼前一亮。 今年,这些模型在美国数学邀请赛中的表现接近优秀高中生水平。不同于过去"一锤定音"式的输 出,这些模型开始尝试模拟数学家逐步推理的思考过程。 同时,一些将LLM与某种事实核查系统相结合的新型混合模型也取得了突破。例如,谷歌"深度思 维"的AlphaProof系统将语言模型与棋类AI——AlphaZero结合,成为首个取得与国际数学奥林匹克竞赛 银牌得主成绩相当的系统。今年5月,谷歌的AlphaEvolve模型更进一步,在多个长期未解的数学与 ...
陶哲轩转发!华人数学博士后反超DeepMind AI,停滞18年数学问题1个月内3次突破
量子位· 2025-06-04 09:14
DeepMind于5月14日宣布 AlphaEvolve ,不仅改进了矩阵乘法算法,还取得一系列成果,打破 集合和差问题 (Sums and differences of sets problem)自2007年来的纪录也是其中之一。 这一次,人类方法使用测度集中性来计算渐近值, 只需要少量的计算机辅助 。 不到一个月时间,这个 停滞18年 的问题在人类与AI共同努力下3 次取得突破 。 陶哲轩转发评价道: 对我来说,这生动展示了处理数学问题时,大量计算机辅助、适度计算机辅助和传统"纸笔"方法未来的相互作用,这些模式各有优缺 点。 例如当前的AlphaEvolve很难处理后续论文中使用的渐近构造。 但另一方面,如果不先进行类似AlphaEvolve的半自动化搜索,人类方法也很难找到这些改进的机会。 梦晨 发自 凹非寺 量子位 | 公众号 QbitAI 数学家出手反击AI!对AlphaEvolve在"集合和差问题"上的成果进一步改进。 最新成果来自西班牙数学科学研究所ICMAT的博士后 Fan Zheng , 这次他通过构造一系列特殊的集合U,在极限情况下将集合和差问题θ的下界提升至1.173077。 集合和差问 ...
陶哲轩转发!DeepMind开源「AI数学证明标准习题集」
量子位· 2025-05-31 03:34
闻乐 发自 凹非寺 量子位 | 公众号 QbitAI 陶哲轩转发,AI搞数学证明的标准习题集来了! DeepMind最新开源 形式化数学猜想库 —— 猜想库收录了经典的形式化表述的数学猜想集合,例如,解析数论中的四个朗道问题。 不仅如此,资源库中还提供了各种代码函数,以方便用户对自然语言的数学猜想进行形式化的表述。 DeepMind的形式化数学猜想库一经建成,团队就表示所有人都可以将数学猜想添加到资源库中,呼吁大家积极参与。 感兴趣的数学家们可以行动起来了。 陶哲轩曾用Lean形式化证明了PFR猜想(多项式Freiman-Ruzsa猜想),这项成就的第一步就是将猜想的核心概念转化为计算机可验证的形 式化版本。 目前,这位"数学界的计算机推广大神"已转发此项目,并表示: "如果希望利用自动化工具帮助开放性问题,那么对这些问题进行形式化表述是重要的第一步。" 形式化数学猜想库有什么用 虽然带证明的形式化定理语料库不断扩充,但仅陈述开放式猜想的形式化资源却十分稀缺。 这类资源有望成为自动定理证明或形式化工具的测试基准,来帮助AI模型提升数学推理及证明能力。 DeepMind此次开源的猜想库在一定程度上缓解了这个问题 ...
形式化证明与大模型:共创可验证的AI数学未来|量子位直播
量子位· 2025-05-27 03:53
现在,AI完成自动定理证明的表现与挑战究竟如何?主流的技术路径是什么?AI完成形式化 证明的能力,又将对大模型应用带来怎样的影响? 为了回答这些问题, 5月29日20:00 ,我们与2077AI开源基金会共同邀请到了来自 DeepSeek Prover 、 FormalMath 、 Kinima 等项目团队的成员,一同来讨论 大语言模 型形式化证明前沿探索 。 点击下方按钮,一键预约直播 就在5月,前有 DeepSeek Prover V2 发布,后有 陶哲轩的AI数学直播 ,还有谷歌最新发 布的 AlphaEvolve 。 大模型"解数学题"的能力已经是衡量 AI「智能天花板」 的一种方式,正吸引着无数团队争 相挑战。 为了更好地评估AI完成数学推理的能力,近期发布的 FormalMATH基准测试 也备受关注。 林樾 发自 凹非寺 量子位|公众号 QbitAI 也欢迎你加入 量子位每日AI交流群 ,一起来畅聊AI吧~ 一键关注 点亮星标 本周四晚20:00,一起来聊聊 AI数学 吧~ 一键三连 「点赞」「转发」「小心心」 欢迎在评论区留下你的想法! — 完 — 量子位AI主题策划 正在征集中! 欢迎参与专题 ...
AI观察|AI发展时间表引发热议,Agent进入爆发“窗口期”
Huan Qiu Wang· 2025-05-26 09:34
在国内,AI Agent的发展同样值得期待。年初由蝴蝶效应公司发布的Manus,发布之初名气与DeepSeek齐名。在功能上, 实现了自主规划任务并实时调整。业内人士认为,Manus用了一种极具冲击力的交互方式展现了多智能体工具如何处理复 杂任务的能力。它的分享内容,不是传统的图片,而是AI处理任务的完整视频,让用户能直观看到AI一步步拆解和执行任 务,带来极强的震撼感。 在产业Agent领域,以浪潮海岳商业AI为代表的智能体,以浪潮海岳大模型为智能能力基座、浪潮海岳软件为宿主,涵盖 100 + 开箱即用的场景智能体,支撑财务、供应链、项目管理等 40 余个高价值场景一站式落地,其整合 120 万家企业最佳 实践,打造了覆盖 2000 + 业务规则、5000 + 行业业务场景的知识库,面向企业经营管理、生产运营等领域业务痛点,打通 企业智能化落地最后一公里。例如在某大型建筑央企桥梁施工工程智能化示范项目中,其针对施工方案编制工作量大的痛 点,通过接入客户 1TB + 专业知识搭建桥梁专项施工方案 AI 辅助编制平台,动态构建 1100 余个任务智能体,使编制效率 提升 95% 以上。 对于Agent在产业端的 ...
85%腾讯程序员使用CodeBuddy,腾讯重新思考工作流程
Di Yi Cai Jing· 2025-05-21 10:14
AI代码工具的应用已经让腾讯开始思考是否需要变更工作流程。腾讯云副总裁吴运声告诉记者,AI生 成的代码占腾讯代码的比例有明显提升,他的团队也在用AI代码助手。就AI代码工具使用后是否需要 调整工作流程或推动技术人员转型,吴运声表示,公司正在探讨这个话题,"(AI代码助手)对个人而 言提效很明显,但这个变化发生后,最终还是要达到组织提效的目标,组织上需不需要因为个人提效或 开发模式变化而做一些配套工作,我们确实在思考。" 一般而言,智能体能力基于大模型,但相比大模型的一问一答的形式,智能体可更主动地执行任务和解 决问题。不仅AI代码工具在加入智能体能力,大模型厂商也在推动智能体技术在更多领域应用。5月21 日,腾讯云将大模型知识引擎升级为智能体开发平台,基于RAG(搜索增强)技术,该平台针对企业 非结构化知识可以自动生成问答等,供企业建造专属智能体。 "AI代码助手对个人而言提效很明显,但这个变化发生后,最终还是要达到组织提效的目标。" 5月21日,腾讯在腾讯云AI产业应用峰会上透露,公司已经有85%的程序员使用腾讯云代码助手 CodeBuddy,该助手使整体编码时间缩短40%。这一代码助手今年4月进行过升级, ...
全球AI周报:AI推动腾讯阿里业绩增长,GoogleI/O2025预计推出AI眼镜-20250519
Tianfeng Securities· 2025-05-19 15:30
证券研究报告 2025年05月19日 海外行业报告:行业动态研究 AI推动腾讯阿里业绩增长,Google I/O 2025预计推出AI眼镜 作者: 分析师 孔蓉 SAC执业证书编号:S1110521020002 分析师 李泽宇 SAC执业证书编号:S1110520110002 分析师 樊程安吉 SAC执业证书编号:S1110524080001 分析师 杨雨辰 SAC执业证书编号:S1110521110001 分析师 刘诗雨 SAC执业证书编号:S1110524120001 请务必阅读正文之后的信息披露和免责申明 1 全球AI周报 摘要 ◼ 重点公司财报AI进展 ◼ 全球AI动态: ◼ 投资建议: ➢ 海外AI: 请务必阅读正文之后的信息披露和免责申明 2 ➢ 腾讯:一季度腾讯季度资本支出达到274.8亿元人民币,同比增长91%,占营收的15%。腾讯的广告收入同比增长20%至319亿元人民币,实现了连续十个季度的两位数增长。公司通过提升生成式AI能力,升级广告技术平台,包括辅助广 告制作、数字人直播、加深商品与用户兴趣理解以提升推荐效果。 ➢ 阿里巴巴:云业务增速依旧维持高位,Capex环比下降系季节性影响。云 ...
国泰海通|计算机:发展Agent已成各大厂共识,新规激发并购重组市场活力
国泰海通证券研究· 2025-05-19 14:20
报告导读: 字节谷歌再发相关新品,AI Agent规模化商业落地元年加速到来。 投资建议: AIAgent 发展与落地仍在稳步发展,不断佐证我们的判断: 2025 年将会成为 AI Agent 规模 化商业落地的元年。证监会的新规则有望加速计算机板块数字化转型需求推动的细分领域整合。我们维持 计算机板块"增持"评级。 字节多款模型升级,发布全场景智能体 DataAgent 。 5 月 13 日,字节跳动火山引擎发布豆包·视频生 成模型 Seedance 1.0 lite ,支持文生视频、图生视频,视频生成时长支持 5s 、 10s ,分辨率提供 480P 、 720P ;豆包 1.5 ·视觉深度思考模型,激活参数仅 20B ,但具备强大的多模态理解和推理能 力,在视频理解、视觉推理、 GUI Agent 能力等方面均处于第一梯队。此外字节还升级了豆包·音乐模 型。同时, Data Agent 正式亮相、 Trae 接入豆包深度思考模型并全新升级。火山引擎正在以更强大的 模型矩阵、更丰富的智能体工具,帮助企业打通从业务到智能体的应用链路。我们认为, AI 技术迭代和 Agent 落地仍然在各大厂中稳步推进当中, ...
AI带动阿里、腾讯业务活力,积极看好AI与军工信息化
Tianfeng Securities· 2025-05-18 15:21
行业报告 | 行业研究周报 通信 证券研究报告 AI 带动阿里&腾讯业务活力,积极看好 AI 与军工信息化 本周行业动态: 阿里、腾讯发布最新财报 其中,阿里方面,在 AI 需求的强劲推动下,云智能集团季度收入增长加速至 18%,其中 AI 相关产品收入连续七个季度实现三位数增长。腾讯方面,AI 战略全面 激活腾讯生态活力,提升产品使用体验,带来更多高质量收入。同时继续加大 AI 领域投入。25Q1,腾讯研发支出达 189.1 亿元,同比增长 21%;资本开支 274.8 亿 元,同比增幅达 91%。 美国撤销拜登时期 AI 芯片出口限制 当地时间 5 月 13 日,美国商务部工业与安全局(BIS)发布公告称,美国启动撤销 拜登政府颁布的《人工智能扩散规则》(Al Diffusion Rule),同时宣布将采取进一步 措施加强全球范围内对半导体的出口管制。 本周投资观点: 公司业绩陆续披露完毕,通信产业展现新旧动能切换。我们仍然看好 AI 行业作为 年度投资主线,后续伴随着 DeepSeek R2/V4 等以及包括 Agent、多模态方面相 关进展,仍然看好 AI 行业以及围绕 AIDC 产业链的持续高景气。 ...
AI浪潮下运营商的算力布局
GOLDEN SUN SECURITIES· 2025-05-18 06:50
证券研究报告 | 行业周报 gszqdatemark 2025 05 18 年 月 日 通信 AI 浪潮下运营商的算力布局 【Capex:AI 浪潮下的优化方向】 从投资侧来看,运营商将同样跟随目前 AI 快速发展的趋势,结构优化方 向确定性明显。从近三年数据看,国内三大运营商资本开支年降较为明 显,而在此基础上则是结构上的优化。中国电信在业绩说明会上明确 表示,25 年资本开支占收比将有明显下降,但从三大运营商给出的 25 年指引来看,算力投资却保持增长或稳定趋势,均表明其布局 AI 的决 心。 【云计算:AI 催化下的新增长曲线】 云计算作为信息技术领域的基石,在 AI 加速的催化下再次迎来边际变化, 应用潜力显著提升中。在此趋势下,三大运营商角色将被重新定义,目前 三大运营商在云建设方面均有深度布局: 增持(维持) 行业走势 -20% -6% 8% 22% 36% 50% 2024-05 2024-09 2025-01 2025-05 通信 沪深300 作者 分析师 宋嘉吉 执业证书编号:S0680519010002 邮箱:songjiaji@gszq.com 分析师 黄瀚 执业证书编号:S068051 ...