联合进化算法

Search documents
京东集团算法总监韩艾将在 AICon 北京站分享基于强化学习的异构多智能体联合进化算法
AI前线· 2025-06-20 02:47
6 月 27 日 -6 月 28 日, AICon 全球人工智能开发与应用大会北京站 即将拉开帷幕。本次大会 将汇聚 AI 前沿技术与落地实践,邀请来自腾讯、阿里、百度、字节跳动等头部大厂以及智谱、 硅基流动、智象未来、声智科技等 AI 企业的 50+ 资深专家,深度探讨 AI Agent、多模态应用、 推理性能优化以及 AI 在软件研发、数据分析、业务运营等场景的具体落地实践。 京东集团算法总监韩艾已确认出席并发表题为《 JDAgents-R1:基于强化学习的异构多智能体 联合进化算法 》的主题分享。多智能体强化学习(MARL)已成为处理日益复杂任务的重要范 式。然而,异构智能体之间的联合进化仍面临合作效率低与训练不稳定等挑战。为此,京东提出 了 一 种 面 向 MARL 的 联 合 进 化 算 法 框 架 JDAgents-R1 , 该 方 法 首 次 将 组 相 对 策 略 优 化 (GRPO)应用于异构多智能体的联合训练中。通过迭代优化智能体的大语言模型(LLMs)与自 适应记忆机制,JDAgents-R1 实现了决策能力与记忆能力的动态均衡,并能有效减少重复推理、 加快训练收敛。在通用场景以及商家定 ...