Workflow
多智能体系统
icon
Search documents
ICML 2025 Spotlight | 谁导致了多智能体系统的失败?首个「自动化失败归因」研究出炉
机器之心· 2025-05-30 03:28
问题来了:到底是哪个 Agent 出了错?又是在对话流程的哪一环节?调试这样的多智能体系统如同大海捞针,需要翻阅大量复杂日志,极其耗时。 这并非虚构。在多智能体 LLM 系统中,失败常见但难以诊断。随着这类系统愈加普及,我们急需新方法快速定位错误。正因如此,ICML 2025 的一篇 Spotlight 论 文提出了「自动化失败归因(Automated Failure Attribution)」的新研究方向,目标是让 AI 自动回答:是谁、在哪一步导致了失败。 该工作由 Penn State、Duke、UW、Goolge DeepMind 等机构的多位研究人员合作完成。 论文标题:Which Agent Causes Task Failures and When? On Automated Failure Attribution of LLM Multi-Agent Systems 背景挑战 LLM 驱动的多智能体系统在诸多领域展现出巨大潜力,从自动化助手协同办公到多 Agent 合作完成 Web 复杂操作等。然而,这些系统 脆弱性 也逐渐显现:多个 Agent 之间的误解、信息传递错误或决策不当,都可能导致 ...
AI智能体(七):多智能体架构
3 6 Ke· 2025-05-20 23:13
神译局是36氪旗下编译团队,关注科技、商业、职场、生活等领域,重点介绍国外的新技术、新观点、新风向。 编者按:2025年是AI智能体元年。本系列文章旨在介绍AI智能体的概念、类型、原理、架构、开发等,为进一步了解AI智能体提供入门知识。本文为系列 文章的第七篇,文章来自编译。 引言 智能体是通过大语言模型(LLM)控制应用流程的系统。随着系统复杂度增加,管理和扩展会愈发困难,常见问题包括: 智能体工具过多导致决策低效 单智能体难以处理复杂的上下文 系统需要多个专业领域的配合(如规划师、研究员、数学专家等) 随着智能框架的发展,企业开始构建多智能体系统,寻求通用解决方案。两年前研究者开发了ChatDev协作系统,这个虚拟软件公司通过CEO、产品总监、 设计师、程序员等多角色智能体协同工作,成功开发出电子游戏。 单智能体架构 问题表现包括: 在涉及到数据提取、报告生成等差异化任务时,多智能体分工优势显现。各智能体专注专业领域,提升解决方案质量,同时降低开发难度。 工具过载:选择困难症 上下文膨胀:超出处理能力 错误增加:泛化职责导致输出劣化 多智能体架构 这些智能体成功协作开发游戏后,人们认为多角色架构可解决所有 ...
基于奖励驱动和自组织演化机制,全新框架ReSo重塑复杂推理任务中的智能协作
机器之心· 2025-04-27 10:40
本文由上海人工智能实验室,悉尼大学,牛津大学联合完成。第一作者周恒为上海 ailab 实习生和 Independent Researcher 耿鹤嘉。通讯作者为上海人工智能实验 室青年科学家白磊和牛津大学访问学者,悉尼大学博士生尹榛菲,团队其他成员还有 ailab 实习生薛翔元。 ReSo 框架( Re ward-driven & S elf- o rganizing)为复杂推理任务中的多智能体系统(MAS)提供了全新解法,在处理复杂任务时,先分解生成任务图,再为每个 子任务匹配最佳 agent。将任务图生成与奖励驱动的两阶段智能体选择过程相结合,该方法不仅提升了多智能体协作的效率,还为增强多智能体的推理能力开辟了 新路径。 研究背景:LLM 推理能力的掣肘与突破口 近年来, 增加推理时间(Inference Time Scaling) 被广泛认为是提升大语言模型(Large Language Models, LLMs)推理能力的重要途径之一。一方面,通过在训 练后阶段引入强化学习与奖励模型,可优化单一模型的推理路径,使其在回答前生成中间步骤,表现出更强的逻辑链构建能力;另一方面,也有研究尝试构建 多 智能体 ...
巨头抢滩AI智能体,资本沸腾了
投中网· 2025-03-12 04:49
锌财经 . 以下文章来源于锌财经 ,作者路世明 关注新商业,关注新经济。一家由人民网投资的数字化媒体机构。 将投中网设为"星标⭐",第一时间收获最新推送 AI Agent的竞争既充满想象力,又暗藏风险。 作者丨路世明 编辑丨 大风 来源丨锌财经 Manus的出现,激起了科技与资本市场的双重震荡,一时间AI Agent相关概念股集体大涨,阿里、谷 歌、微软等科技巨头密集发布智能体研发计划...... 而在这场热潮的背后,是AI技术从"被动应答"向"主动执行"的范式跃迁。 尽管市场的评价褒贬不一,但不能否认,Manus的突破性在于,它首次验证了通用型AI Agent在复杂 场景下的商业化可行性。 传统的大语言模型虽能生成文本,却难以闭环执行任务,而Manus通过"规划-验证-执行"的架构,将 AI大模型的认知能力转化为生产力工具。 根据麦肯锡等多份权威报告,在多元化需求驱动下,AI Agent市场呈爆发式增长态势,2024年全球 AI Agent市场规模约为51亿美元,预计2030年将飙升至471亿美元,复合年增长率高达44.8%。 然而,这场"智能体浪潮"并非坦途。技术瓶颈与商业野心的碰撞,让AI Agent的 ...