Agent
Search documents
Agent 开发的上半场: 环境、Tools 和 Context 如何决定 Agent | 42章经
42章经· 2025-04-27 14:10
23 年 4 月以 AutoGPT 为代表的那一波里,Agent 更像是一个玩具,demo 都很炫,但实际应用价值很有限。 经过两年的发展,这波 Agent 确实能够在实际的工作和生活场景中解决问题,为大家带来价值了。 曲凯: Agent 是当下绝对的风口。关于 Agent 这个话题,我自己有一些核心在思考的问题,相信也是很多人同样会有疑问的地方。所以今天我们请来了长时间对 Agent 有研究和实操的文锋,想就这些问题展开一些讨论。 首先我想问,到底怎么定义 Agent? 文锋: 我认为最好的就是 Anthropic 的定义:Agent 是让模型基于环境反馈去使用工具的一个程序。 曲凯: 那你怎么看最近这波 Agent 热? 文锋: 这波 Agent 跟过去非常不一样。 之所以会有这种跃迁,一是因为底层模型能力有了很大的进步,尤其是在结合了 RL 之后,以 o1 为代表的模型还赋予了 Agent 长思维能力。 二是因为 Agent 的工程侧和产品侧也有很大的突破,主要表现就是大家更知道该怎么给 Agent 构建一个合适的 Context,从而更好地解决问题了。 曲凯: 怎么理解这个 Context? 文锋: ...
Manus估值36亿了?
投中网· 2025-04-27 06:35
将投中网设为"星标⭐",第一时间收获最新推送 硅谷顶级VC也来投了。 作者丨 刘燕秋 来源丨 投中网 模型推理能力的显著提升,使得 Agent 成为 2025 年最热的 AI 投资方向,在这波热潮中, Manus 成为第一个在国内刷屏的 Agent ,甚至可以说开 启了 Agent 元年。 这家公司最近又有新动向。据外媒援引知情人士消息, Manus AI 背后的公司 " 蝴蝶效应 " 获得了由美国风投 Benchmark 领投的一轮融资,融资金 额达 7500 万美元(约合 5.46 亿人民币)。此前M anus 已从腾讯、真格基金和红杉中国等投资人那里筹集了超过 1000 万美元。这轮融资让 Manus AI 的估值增长了约 5 倍,提升至近 5 亿美元(约合 36.44 亿人民币)。 我拿这条信息跟 Manus 团队求证,截至发稿暂无回应。 今年 3 月, Manus 发布了一款尚在内测中的通用 AI Agent ,能够独立处理简历筛选、行程规划和股票分析等任务,并声称在多项指标上的表现均优 于 OpenAI 近期推出的 Deep Research 。最近它还推出了订阅服务,价格为每月 39 美元,高级 ...
Windsurf团队科普Agent:不是什么都叫智能体!
Founder Park· 2025-04-25 13:29
Windsurf 团队的联合创始人 Anshul Ramachandran 最近发布了一篇关于 Agent 的科普文章,对于现下被广泛讨论,且经常被误用混淆的各种 Agent 概念 进行了辨析,同时对 Agent 系统的核心构成进行了拆解。如果你想要通过一篇全面地了解关于 Agent 的基础情况,这是一篇相当不错的资料。 以下为《What is an Agent?》全文内容,Founder Park 进行了编译和适当的调整。 Founder Park 正在搭建开发者社群,邀请积极尝试、测试新模型、新技术的开发者、创业者们加入,请扫码详细填写你的产品/项目信息,通过审核 后工作人员会拉你入群~ 进群之后,你有机会得到: 欢迎来到 2025 年,这一年 「Agent」 一词的使用频率极高,其含义也变得相当宽泛。在日常交流中,人们基于各自的理解 confidenty 地使用这 个词,反而使其原本清晰的含义逐渐模糊。 如果你是一名开发者,正在构建与 Agent 相关的解决方案,那么本文可能并不适合你。本文更适合以下几类人群: 在会议、讨论或日常对话中听到他人提及 AI Agent 时心存疑惑的朋友,或许你对 Agen ...
人工智能行业专题:大厂Agent来临,MCP拓宽应用边界
Guoxin Securities· 2025-04-24 07:52
Investment Rating - The report maintains an "Outperform" rating for the industry [1][37]. Core Insights - The emergence of general-purpose AI agents, such as ByteDance's "Kouzi Space," marks the beginning of competition among major tech companies, with expectations for rapid advancements from Alibaba and Tencent [2][11]. - The development of Model Context Protocol (MCP) is anticipated to standardize AI applications, enhancing the capabilities of AI agents and accelerating ecosystem expansion [8][11]. - The report emphasizes the potential of AI agents to redefine human-machine collaboration, providing new avenues for AI application development [33]. Summary by Sections ByteDance: Launch of General-Purpose Agent - ByteDance's "Kouzi Space" allows users to interact with AI agents for task completion, featuring a dual mode for exploration and planning [4][11]. - The platform supports the integration of MCP, expanding the capabilities of AI agents and facilitating the addition of various plugins [8][11]. Zhipu: Full-Stack Self-Development and Open Source - Zhipu's AutoGLM "Meditation" model showcases advanced research and operational capabilities, achieving state-of-the-art performance in multiple testing environments [15][19]. - The model's open-source approach is expected to foster ecosystem growth and accelerate application scenarios [20]. Genspark: Integration of Multiple AI Models for Accurate Responses - Genspark's Super Agent utilizes a mixed-agent system, integrating over 80 tools and 10 advanced datasets to enhance task execution efficiency [28][31]. - The platform has demonstrated superior performance in benchmark tests compared to other leading AI products [24][28]. Investment Recommendations - The report suggests that the development of AI agents opens new paradigms for human-machine collaboration, with a positive outlook on the future of AI applications [2][33].
Deep Research类产品深度测评:下一个大模型产品跃迁点到来了吗?
Founder Park· 2025-04-23 12:37
以下文章来源于海外独角兽 ,作者拾象 Founder Park 正在搭建开发者社群,邀请积极尝试、测试新模型、新技术的开发者、创业者们加入,请扫码详细填写你的产品/项目信息,通过 审核后工作人员会拉你入群~ 海外独角兽 . 研究科技大航海时代的伟大公司。 Deep Research 产品可被理解为 一个以大模型能力为基础、集合了检索与报告生成的端到端系统,对信息进行迭代搜索和分析,并生成详细报告作为输 出。 参考 Han Lee 的 2x2 分析框架,目前 Deep Research 类产品在 输出深度、训练程度 两大维度呈现分异。 输出深度 即产品在先前研究成果的基础上进行了 多少次迭代循环以收集更多信息,可进一步被理解为 Agentic 能力的必要基础。 低训练程度 指代经过人工干预和调整的系统,比如使用人工调整的 prompt,高训练程度则是指利用机器学习对系统进行训练。 和传统 LLM Search 产品相比,Deep Research 是迈向 Agent 产品雏形的一次跃迁,可能也将成为具有阶段代表性的经典产品形态。 Deep Research 产品通过系列推理模型嵌入,已生长出了 Agent 产品 ...
Agents和Workflows孰好孰坏,LangChain创始人和OpenAI杠上了
Founder Park· 2025-04-21 12:23
但 LangChain 创始人 Harrison Chase 对于 OpenAI 在文中的一些观点持有异议,尤其是「通过 LLMs 来主导 Agent」的路线,迅速发表了一篇长文回 应。 Harrison Chase 认为,并非要通过严格的「二元论」来区分 Agent,目前我们看到大多数的「Agentic 系统」都是 Workflows 和 Agents 的结合。理想 的 Agent 框架应该允许从「结构化工作流」逐步过渡到「由模型驱动」,并在两者之间灵活切换。 相比 OpenAI 的文章,Harrison Chase 更认同 Anthropic 此前发布的如何构建高效 Agents 的文章,对于 Agent 的定义,Anthropic 提出了「Agentic 系 统」的概念,并且把 Workflows 和 Agents 都看作是其不同表现形式。 总的来说, 这是大模型派(Big Model)和工作流派(Big Workflow)的又一次争锋, 前者认为每次模型升级都可能让精心设计的工作流瞬间过 时,这种「苦涩的教训」让他们更倾向于构建通用型、结构最少的智能体系统。而以 LangGraph 为代表的后者,强调 ...
扣子空间一手实测:字节的第一个Agent,比Manus如何?
Founder Park· 2025-04-21 12:23
字节的 Agent 产品来了。 4 月 18 日晚间,字节跳动扣子空间开启内测,定位通用 Agent。与其他类似产品如 manus 一样,扣子空间采用了邀请码制。 平台上,用户可以选择精通各项技能的「通用实习生」,也可以选择行业的「领域专家」,通过与 AI 的互动完成工作任务。 就在前一天,火山引擎刚刚面向企业市场推出 OS Agent 解决方案及 AI 云原生推理套件,要帮企业更快、更省地构建和部署 Agent 应用。 扣子有探索和规划两种模式,如果想让它一步到位输出,可以选择探索模式;如果想亲自把控每个步骤,可以选择规划模式。 虽然采用了邀请码制,但扣子显然不是走饥饿营销的路线。用户激活获得的邀请码后,创建并完成一个新任务即可获得 5 个邀请码,邀请码激 活后,还可获得更多邀请资格,多创建多获得多邀请。 上线的第一时间,极客公园就上手实测了扣子空间的 Agent 功能。可以看到,在执行的三个任务中,制定旅游攻略和一周穿搭的任务顺利完 成,但另一个专家助手的任务,却出现了 Python 脚本调用失败、 API 权限异常等 Bug,一个晚上都没能执行成功。 字节迈出了走向 Agent 时代的第一步,但距离完美 ...
复盘字节扣子空间开发历程:瞄准工作场景,做一个 Agent 系统
晚点LatePost· 2025-04-21 09:36
ChatGPT 让聊天窗成为大模型应用首选的交互界面。理由是当 AI 足够聪明,似乎就不需要用户学 习,不用熟悉按钮和菜单、只用自然语言下命令就够了。 字节在 2023 年下半年搭起 AI 应用开发平台 "扣子(Coze)",让开发者不需要熟悉复杂的技术能 力,就能将自己的数据接入最前沿的大模型,做各式各样的应用。到 2024 年中,扣子团队发现,尽 管聊天机器人应用成千上万地出现,从知识问答到情感陪伴,覆盖几乎所有热门的场景,但大多面临 相同的问题:用户增长难,留存更难。 这是一个产品形态与用户真实需求形成偏差的案例。聊天界面简单易用,但对大模型要求极高,导致 不论中美都是一两个通用 AI 聊天应用断层式领先。扣子团队发现,平台上有一类应用的增长和留存 明显更好——嵌入到用户工作流的大模型应用,针对具体工作场景解决具体问题。 这成为他们去年下半年的工作重点。用大模型改造工作流,在工作场景中完成繁琐的任务,正是当下 行业热议的 Agent 初始形态。 大厂团队开发 AI 产品的样本。 4 月 18 日周五晚,字节的 Agent 产品 "扣子空间(space.coze.cn) " 开启内测。团队为此准备不少算 ...
计算机行业周报:Agent,从“单点工具”到“数字员工”
Tebon Securities· 2025-04-20 01:23
Investment Rating - The report maintains an "Outperform" rating for the computer industry [2][13]. Core Insights - OpenAI has launched two groundbreaking AI models, o3 and o4-mini, enhancing multimodal and tool usage capabilities, marking a shift from language models to task agent models [6]. - The integration of image reasoning and tool usage allows these models to manipulate images during reasoning, significantly broadening AI application scope [6]. - The performance of o3 and o4-mini has set new benchmarks in various fields, including programming and visual perception, with o4-mini achieving a high score of 99.5% in AIME 2025 tests [7]. - The pricing structure for OpenAI's models indicates a competitive market positioning, with o3 priced at $10 per 1M tokens for input and o4-mini at $1.1 per 1M tokens [7]. - The report suggests that 2025 may be a pivotal year for the development of AI agents, with increasing computational demands expected as AI applications deepen [9]. Summary by Sections Market Performance - The computer industry has shown a significant performance trend, with a noted decline of 27% in the past year compared to the Shanghai and Shenzhen 300 index [3]. Related Research - Several related reports have been published, focusing on the recovery of domestic stocks post-external shocks, the resurgence of domestic products, and improvements in supply-demand dynamics within the industry [4]. AI Tools and Agents - The introduction of WeChat's AI assistant "Yuanbao" enhances the capabilities of agents within the WeChat ecosystem, potentially increasing AI application penetration in daily life [9]. - The MCP and A2A protocols are expected to facilitate seamless communication and collaboration among different AI agents, enhancing their functionality and efficiency [9]. Investment Recommendations - The report recommends focusing on various sectors, including AI tools, AI agents, multimodal AI, and AI computing power, highlighting specific companies within each category for potential investment opportunities [9].
火山总裁谭待:很多Agent的能力还停留在类似自动驾驶的L1阶段
news flash· 2025-04-17 11:17
Core Viewpoint - The development direction of the industry is to create Agents with advanced reflection, planning, and autonomous decision-making capabilities, moving beyond the current basic level of many Agents [1] Group 1: Agent Development - The foundation for building Agents is deep thinking models, which must possess the ability to think, plan, and reflect [1] - Agents should support multimodal capabilities, similar to human visual and auditory functions, to better handle complex tasks [1] Group 2: Product Launch - The Doubao 1.5 deep thinking model was officially launched, showcasing strong performance in general tasks such as mathematics, programming, scientific reasoning, and creative writing [1] - A visual version of the deep thinking model was introduced, which has visual reasoning capabilities, allowing it to associate and think about what it sees like a human [1]