Workflow
多智能体系统
icon
Search documents
「0天复刻Manus」的背后,这名95后技术人坚信:“通用Agent一定存在,Agent也有Scaling Law”| 万有引力
AI科技大本营· 2025-07-11 09:10
以下文章来源于CSDN ,作者万有引力 CSDN . 成就一亿技术人 嘉宾 | 范文栋 对话 | 唐小引 责编 | 郑丽媛 出品 | CSDN(ID:CSDNnews) 今年 3 月,Manus 的横空出世,引爆 了 新一轮 的 AI Agent 热潮 。 人们惊讶地发现,原本复杂繁琐的任务流,如今一个 Agent 就能自动规划、调用工具、执行操作,甚至还能主动 Debug 和自我修复——生成式 AI 从" 语言理解"向"任务执行"演化, Agent 也 不再是只能聊天的大语言模型,而是可以"动手做事"的数字助手 。 然而,在 这场技术热潮中,质疑与分歧也接踵而至:" Agent 的 Scaling Law 是否存在 "、" 通用 Agent 是否真的可行 " , 这些 问题 引发了广泛的 争议与探讨。一方面,部分研究者坚信,随着模型技术的进步,Agent 将能实现从特定任务向通用能力的跨越;而另 一 方面,也有声音指出 , 所谓 的"通用 Agent", 或许 只 是一套被过度期许的工程幻象。 为了解答这些技术 争议,由 CSDN 主办 的《万有引 力》栏目 在 全球机器学习技术大会 的现场特别邀请到了 C ...
给你一群顶尖AI,如何组队才能发挥最大战力?UIUC用一个新的多智能体协作基准寻找答案
机器之心· 2025-07-09 04:23
朱昆仑是伊利诺伊大学香槟分校(UIUC)计算机科学系的研究生,现隶属于Ulab与Blender Lab,曾在斯坦福大学、卡内基梅隆大学(CMU)与蒙特利尔学习算 法研究所(Mila)进行学术访问。他的研究方向包括大语言模型(LLM)智能体、多智能体系统、AI科学家与工具学习等,在ICML、ICLR、ACL、TMLR等顶 级会议与期刊发表论文10余篇,总引用超过1500次。 他积极参与多个广泛影响的开源项目,包括 OpenManus(RL)、ChatDev(MACNET)、ToolBench 等,累计 在 GitHub 上获得超过 5万+ stars。此外,他曾受邀在 AMD 开发者大会、阿里巴巴云栖大会等重要学术与工业会议中作报告,分享其在AI智能体方面的开源成 果。 这不仅是一个评测集,更是首个能够全面、系统化地评估 LLM 多智能体系统协作与竞争能力的综合性基准。它不仅仅是一套「考题」,而更像一个「模拟 真实社会动态的实验室」,旨在揭示多智能体协作的奥秘,并回答一系列关键问题: …… 论文标题: MultiAgentBench:Evaluating the Collaboration and Compet ...
探索金融多领域应用 中财融通大模型及上市公司研报智能体发布
Sou Hu Cai Jing· 2025-07-06 14:55
中财融通大模型及上市公司研报智能体CUFEL-A7月5日在中央财经大学主办的2025中关村论坛系列活动-全球财经论坛上正式发布。 王靖一介绍,CUFEL-A智能体通过"资料汇总、规划、架构与反思、撰写"四个步骤,可以对A股上市公司产出独立原创、深度科学的研究报告。研究团队基 于"生成式""端到端""多智能体系统整体强化学习"三大原则构建研报评估算法,基于数十万份券商研报构建研报评价算法,提升研报撰写质量。 "CUFEL-A是我们对人工智能在金融应用范式的第一次探索,这种问题解决流程可以迁移至其他金融领域:基于头部大模型构建多智能体系统产出高质量成 果,通过部署应用产出数据;数据用于微调轻量化模型,轻量化模型部署回多智能体系统满足行业本地化部署需求。"王靖一说。 上证报中国证券网讯(记者 刘暄)中财融通大模型(Chinese Unified Financial and Economic LLMs,下称CUFEL)及上市公司研报智能体CUFEL-A7月5日在 中央财经大学主办的2025中关村论坛系列活动-全球财经论坛上正式发布。 据了解,该模型由中央财经大学金融学院师生团队自主研发。王靖一透露,当前,团队正积极与 ...
ICML 2025 | 多智能体的ChatGPT时刻?上交MAS-GPT实现工作流一键生成
机器之心· 2025-07-05 02:46
本文第一作者叶锐,上海交通大学博士三年级,研究方向是大模型多智能体,联邦学习,博士导师陈思衡,上海交通大学人工智能学院副教授。 OpenAI 将 "组织级智能 (Organizational AI)" 设定为通向 AGI 的第五个重要阶段 —— 期待 AI 能像一个高效协作的组织那样,处理复杂任务并协调大规模运作。多 智能体系统(Multi-Agent Systems, MAS)正是实现这一目标的重要探索方向。 然而,构建能够支撑这种复杂智能的 MAS 并非易事,研究者们常面临结构繁多、Prompt 调试耗时、难以解决通用任务等挑战…… 如今,一种全新的方法出现了,由上海交通大学人工智能学院、上海人工智能实验室、牛津大学等机构联合推出的 MAS-GPT,正式提出: 生成式 MAS 设计范 式 , 只需一句 Query,就能 "一键生成" 一套可执行、组织清晰的 MAS! 这意味着,构建 MAS 变得 " 像与 ChatGPT 聊天一样简单,一个问题直出完整多智能体系统 "!MAS-GPT,正努力让这条通往 AGI 第五阶段的道路,变得更加 平坦和高效。 该工作 "MAS-GPT: Training LLMs ...
突破多智能体系统边界,开源方案OWL超越OpenAI Deep Research,获17k star
机器之心· 2025-06-17 03:22
港大、camel-ai 等多家机构联合提出了一种名为新的名为 Workforce 的创新多智能体框架,以及配套的 OWL(Optimized Workforce Learning)训练 方法,在通用 AI Assistant 的标杆基准测试 GAIA 上取得了 69.70% 的准确率,不仅刷新了开源系统的最佳纪录,更是超越了多家商业系统以及 OpenAI Deep Research 的开源方案。 该研究成果所有代码均已开源,目前已经在 github 上收获了 17k 的 star。 论文标题:OWL: Optimized Workforce Learning for General Multi-Agent Assistance in Real-World Task Automation 论文地址:https://arxiv.org/abs/2505.23885 项目代码:https://github.com/camel-ai/owl 背景与挑战:多智能体系统的 「 领域壁垒 」 随着 LLM 的飞速发展,单一智能体在处理复杂现实任务时逐渐暴露出局限性。为此,多智能体系统(MAS)应运而生,通过让多个专门化的智 ...
Anthropic 详述如何构建多智能体研究系统:最适合 3 类场景
投资实习所· 2025-06-16 11:51
本文来自 Anthropic 官网的分享,详细阐述了他们是如何构建多智能体研究系统《How we built our multi-agent research system》。 他们研究发现, 多智能体系统最适合三类场景:高价值并行任务、超出单上下文窗口的信息处理、需要操作多个复杂工具的情况。需要共享上下文或存 在复杂依赖关系的场景目前并不适合多智能体方案。 下面是翻译全文: 我们的"研究"功能采用多智能体协作架构,让 Claude 能更高效地探索复杂课题。本文将分享系统构建过程中遇到的工程挑战与经验总结。 如今 Claude 已具备跨网络、Google Workspace 及各类集成系统进行信息检索的研究能力,以完成复杂任务。这套多智能体系统从原型到生产的实践历 程,让我们在系统架构、工具设计和提示工程等方面积累了宝贵经验。 多智能体系统由多个自主使用工具的 LLM 智能体协同工作,在我们的研究功能中,主智能体会根据用户查询规划研究流程,随后创建并行工作的子智能 体进行信息检索 。这类系统在智能体协调、评估与可靠性方面带来了全新挑战。 本文将拆解我们验证有效的设计原则,希望能为开发者构建多智能体系统提供参考 ...
近期必读!Devin VS Anthropic 的多智能体构建方法论
歸藏的AI工具箱· 2025-06-15 08:02
播客内容由 listenhub 生成,懒得看的话也可以听 昨天最热的的两篇文章是关于多智能体系统构建的讨论。 先是 Anthropic 发布了他们在深度搜索多智能体构建过程中的一些经验,具体:包括多智能体系统的优势、架构概览、提示工程与评估、智能体的有效评估等方 面。 另外一边 Devin 的开发商 Cognition 的一个负责人 Walden 发布文章告诫大家不要构建多智能体,指出一些常见但实际效果不佳的方法,特别是多智能体架构的弊 端。 这篇文章主要就是结合两篇文章看一下 Cognition 提到的多智能体架构弊端和 Anthropic 给出的解决方案 。同时后面也会有两篇文章非常详细的总结。 什么是多智能体 多智能体系统由多个智能体(大型语言模型 [LLM] 自主地循环使用工具)协同工作组成。 在这种系统中,一个主智能体(或协调器)会根据用户查询规划研究过程,然后使用工具创建并行操作的子智能体,这些子智能体同时搜索信息。这种架构允许主 智能体协调整个过程,同时将任务委托给专门的子智能体。 所以具体的步骤一般为: 1. 将工作分解为多个部分 首先是领域选择: 他们将多智能体系统应用于他们认为特别适合并行 ...
多智能体在「燃烧」Token!Anthropic公开发现的一切
机器之心· 2025-06-14 04:12
机器之心报道 机器之心编辑部 研究多智能体必读指南。 「Anthropic 发布了他们如何使用多个 Claude AI 智能体构建多智能体研究系统的精彩解释。对于任何构建多智能体系统的人来说,这是一本必读的指南。」刚 刚,X 知名博主 Rohan Paul 强力推荐了 Anthropic 一项新研究。 最近一段时间,关于智能体的研究层出不穷。但这也为广大研究者带来一些困惑,比如什么任务需要多智能体?多个 AI 智能体如何协作?怎么解决上下文和记忆 问题…… 面对这些问题,你不妨读读 Anthropic 的这篇文章,或许能找到答案。 文章地址:https://www.anthropic.com/engineering/built-multi-agent-research-system 多智能体系统的优势 有些研究涉及开放式问题,这类问题往往难以预先确定所需的步骤。对于复杂问题的探索,人类无法硬性规定固定路径,因为这一过程本质上是动态且具有路径 依赖性的。当人们开展研究时,通常会根据发现持续调整方法,沿着调查过程中浮现的线索不断推进。 这种不可预测性使得 AI 智能体特别适合执行研究类任务。研究工作要求具备灵活性 ...
Anthropic是如何构建多智能体系统的? | Jinqiu Select
锦秋集· 2025-06-14 03:58
2025年6月13日,Anthropic工程团队发布了一份详尽的技术文档,公开了他们构建多智能体研究系统的完整历程。这个系统让多个Claude智能体协同工作,能够搜索 网络、Google Workspace以及各种集成系统,完成复杂的研究任务。 在这份万字长文中,工程团队分享了一个关键数据:以Claude Opus 4为主智能体、Claude Sonnet 4为子智能体的多智能体系统,比单独使用Claude Opus 4的性能提 升了90.2%。但这种性能提升是有代价的——多智能体系统使用的token是普通聊天的15倍。 文章揭示了多智能体系统的核心架构:一个主智能体负责分析用户需求、制定研究策略,然后创建多个子智能体并行探索不同维度的信息。每个子智能体拥有独立 的上下文窗口,能够同时处理不同的搜索任务,最后将结果汇总给主智能体。这种设计让系统能够在几分钟内完成原本需要几小时的研究工作。 在构建这个复杂系统的过程中,团队总结出了8条提示工程原则: 在构建从原型到生产级产品的过程中,Anthropic团队分享了关键的工程实践: 资源分配需要明确规则。 早期版本曾为简单查询生成50个子智能体,陷入失控。解决方案是 ...
区域型银行如何实现AI战略突围?
麦肯锡· 2025-06-11 09:24
全文阅读时间约为9分钟。 区域型银行"AI突围战"已打响 。过去24个月,生成式AI在全球金融服务行业的应用持续演进。摩根士 丹利已向约1.5万名财务顾问推出AI工具,帮助他们在客户会议中生成纪要和下一步最佳行动方案, ING已将智能聊天机器人推向10个市场约3,700万名客户。这些都传递出一个清晰的信号:生成式AI竞 赛已从技术探索转向价值变现阶段。对于区域型银行而言,这场关于AI的变革早已不是"选择题",而是 如何捕捉AI价值、实现应用落地的一道"必答题"。 纵观全球银行业生成式AI(GenAI)技术应用现状,我们有以下四点观察: 观察一:AI应用百花齐放,逐步从内部使用向客户端延展 生成式AI及其他人工智能技术正重塑银行内部运营模式和对客服务方式。起初,AI技术仅运用在客户 经理赋能、软件开发提效、信贷报告自动生成等银行内部应用场景,而伴随AI技术的突破,其应用场 景正越来越多向客户端延展,如AI客服机器人、超个性化的市场营销策略等。 观察二:技术持续革新,多智能体系统能提供覆盖复杂流程的"一站式"解决 方案 多智能体系统具备行动规划、使用工具执行规划、与其他智能体及人员合作、边实践边学习以自我改进 的 ...