进化算法

Search documents
京东集团算法总监韩艾将在 AICon 北京站分享基于强化学习的异构多智能体联合进化算法
AI前线· 2025-06-20 02:47
6 月 27 日 -6 月 28 日, AICon 全球人工智能开发与应用大会北京站 即将拉开帷幕。本次大会 将汇聚 AI 前沿技术与落地实践,邀请来自腾讯、阿里、百度、字节跳动等头部大厂以及智谱、 硅基流动、智象未来、声智科技等 AI 企业的 50+ 资深专家,深度探讨 AI Agent、多模态应用、 推理性能优化以及 AI 在软件研发、数据分析、业务运营等场景的具体落地实践。 京东集团算法总监韩艾已确认出席并发表题为《 JDAgents-R1:基于强化学习的异构多智能体 联合进化算法 》的主题分享。多智能体强化学习(MARL)已成为处理日益复杂任务的重要范 式。然而,异构智能体之间的联合进化仍面临合作效率低与训练不稳定等挑战。为此,京东提出 了 一 种 面 向 MARL 的 联 合 进 化 算 法 框 架 JDAgents-R1 , 该 方 法 首 次 将 组 相 对 策 略 优 化 (GRPO)应用于异构多智能体的联合训练中。通过迭代优化智能体的大语言模型(LLMs)与自 适应记忆机制,JDAgents-R1 实现了决策能力与记忆能力的动态均衡,并能有效减少重复推理、 加快训练收敛。在通用场景以及商家定 ...
打破56年数学铁律!谷歌AlphaEvolve自我进化实现算法效率狂飙,堪比AlphaGo“神之一手”
量子位· 2025-05-18 02:01
一水 闻乐 发自 凹非寺 量子位 | 公众号 QbitAI 数学能力几乎和AlphaGo的围棋水平一样?! 这是研究员对AlphaEvolve的最新评价,就在不久之前,谷歌DeepMind联合陶哲轩等一众顶尖科学家打造了 「通用科学人工智能」 AlphaEvolve ,直接打破了矩阵乘法领域56年以来的效率基准。 一位谷歌前员工更是将这一成就类比为传说中的"神之一手": 太疯狂了!AlphaEvolve的数学能力相当于AlphaGo打败人类的"神之一手"第37步。 具体而言, 4x4矩阵乘法 的 49 次标量乘法效率基准已经持续56年,而AlphaEvolve直接将这个数字改写为 48 。 别看数字只前进了一小步,但背后所代表的 更快的矩阵乘法算法 可谓意义重大。 不仅可以解决复杂数学难题,还能用来改进芯片设计、提高数据中心和AI训练的效率。 在谷歌内部使用中,它将Gemini架构中大型矩阵乘法运算加速了23%,从而将Gemini的训练时间缩短了1%,并且还将FlashAttention提速了 32.5%。 那么接下来的问题是—— AlphaEvolve是如何做到的?背后藏着哪些核心技术原理? 在AlphaE ...