Agent

Search documents
对话朱松纯:Agent喧嚣之上,“走心”才是AGI的未来?
AI科技大本营· 2025-04-30 03:02
作者 | 王启隆 出品|《新程序员》 2025 年的AI 领域,似乎没有哪个词比"Agent"更炙手可热。从 OpenAI 的 Operator 到"第一个通用智能体"Manus 的出圈,"智能体元年"的呼声不绝 于耳,仿佛我们距离那个能自主理解、规划、执行任务的通用人工智能(AGI)只有一步之遥。 喧嚣之下,一些根本性的问题挥之不去:究竟何为 Agent?我们真正踏上了通往通用人工智能(AGI)的那条路吗?当前主流的、依赖海量数据和算力 堆砌起来的大模型路径,是否足以孕育出真正拥有理解力、自主性甚至"灵魂"的智能? 当许多人沉浸在狂欢之时,全球知名人工智能科学家、北京通用人工智能研究院院长、北京大学人工智能研究院院长兼智能学院院长朱松纯教授,却在 疾呼一种不同的声音——当前许多所谓的Agent,可能连真正的"智能体"都算不上。 近日,《新程序员》在北京的一场围绕其新书《通用人工智能标准、评级、测试与架构》的媒体见面会上,采访了朱松纯教授。他的观点,或许能为我 们拨开Agent 的迷雾,提供一个审视 AGI 未来更深邃的视角。 《新程序员》: 朱院长您好,今年Agent 是个热词,很多人称 2025 年是"A ...
多模态和Agent成为大厂AI的新赛点
3 6 Ke· 2025-04-29 23:29
Core Insights - The article discusses the evolving landscape of AI applications, focusing on the dual pillars of multimodal capabilities and agent execution as key areas of development in the industry [1][2][3] Multimodal Capabilities - Major companies like ByteDance, Baidu, Google, and OpenAI have recently launched advanced multimodal models, enhancing application innovation [1][5] - Alibaba's AI product Quark introduced a new feature called "Photo Query Quark," which utilizes multimodal capabilities for user interaction [1][6] - OpenAI's latest models, o3 and o4-mini, have achieved significant multimodal understanding, allowing for image analysis and generation [5][16] - The integration of multimodal capabilities is expected to transform user experiences in work, study, and daily life, although current products are still in early exploration stages [2][3] Agent Execution - The article highlights the emergence of general agent products that can execute complex tasks based on natural language commands, with notable examples including ByteDance's Kouzi Space and Baidu's Xinxiang App [1][12] - The effectiveness of these agents relies on three key capabilities: connecting to third-party data and tools, coding ability, and task understanding [12][16] - OpenAI is exploring the acquisition of AI programming startup Windsurf to enhance coding capabilities for agents [16][17] - The anticipated revenue from AI agents is projected to exceed $3 billion by the end of 2025, with a potential contribution of $29 billion by 2029 [17] Future Directions - The article suggests that the future of agents may involve a more human-like ecosystem, with agents being developed according to specific professional roles [17] - The integration of multimodal capabilities with agent execution is seen as crucial for establishing a foundational entry point for future AI applications [17]
做浏览器、买Chrome、争AI OS,Perplexity也想「上牌桌」
Founder Park· 2025-04-28 11:00
Perplexity CEO Aravind Srinivas 近日在接受 TheVerge 采访时表示,「Perplexity 最终的目标是构建像 Windows、Mac、Android 或 iOS 这样的操作系 统,操作系统才是最终极的战场。」 上个月,Perplexity 宣布要进军浏览器市场,即将推出一款名为「Comet」的自有浏览器。Srinivas 认为,「 谁能拥有最丰富的用户上下文信息,谁就能 赢得记忆能力的竞争 。ChatGPT 对用户在 Instagram 或 Amazon 上购买了什么一无所知,它也不知道用户在不同网站上花费的时间。要想实现真正深入 的用户个性化,必须要拥有所有这些数据。这不仅仅是基于检索历史查询来推出简单的记忆功能,因为后者是很容易被复制的。」 进群之后,你有机会得到: Perplexity 创始人兼 CEO Aravind Srinivas 正在与科技巨头 Google 展开较量,力争让其 AI 助手 Perplexity 得以预装在 Android 手机中。与 此同时,这位 CEO 正将其这家初创公司的战略重心,转移至他预判将成为 AI 领域下一个重要战场的阵地:网 ...
行业周报:积极关注高景气社交出海、Agent及多模态AI应用-20250427
KAIYUAN SECURITIES· 2025-04-27 14:34
Investment Rating - The industry investment rating is "Positive" (maintained) [2] Core Viewpoints - The report emphasizes the continued high growth in social and gaming sectors, particularly in the MENA region, and suggests focusing on companies with operational advantages and market positioning [4] - The report highlights the advancements in domestic video models and the ongoing expansion of AI applications, recommending continued investment in AI-related sectors [5] Summary by Sections Industry Data Overview - "Peace Elite" ranks first in the iOS free chart in mainland China, while "Honor of Kings" holds the top position in the iOS revenue chart [12][16] - The film "Sunshine Flower" achieved the highest box office for the week, grossing 0.39 billion CNY [26] Industry News Overview - Coze, an AI tool, entered the domestic top ten rankings, while Photoroom improved its position in the overseas rankings [33] - The report notes the approval of 118 games by the National Press and Publication Administration in April [33] Company Performance Highlights - ZhiZi City Technology reported a total revenue of 5.09 billion CNY for 2024, a year-on-year increase of 53.9%, with social business revenue reaching 4.63 billion CNY, up 58.1% [4] - Yalla Technology reported a revenue of 339.7 million USD for 2024, with a net profit of 134.2 million USD, reflecting an 18.7% year-on-year increase [4] Recommendations - The report recommends focusing on companies with strong market positioning and local operational capabilities, highlighting Tencent Holdings and ShengTian Network as key recommendations, with beneficiaries including ZhiZi City Technology and Yalla Technology [4][5]
Agent 开发的上半场: 环境、Tools 和 Context 如何决定 Agent | 42章经
42章经· 2025-04-27 14:10
23 年 4 月以 AutoGPT 为代表的那一波里,Agent 更像是一个玩具,demo 都很炫,但实际应用价值很有限。 经过两年的发展,这波 Agent 确实能够在实际的工作和生活场景中解决问题,为大家带来价值了。 曲凯: Agent 是当下绝对的风口。关于 Agent 这个话题,我自己有一些核心在思考的问题,相信也是很多人同样会有疑问的地方。所以今天我们请来了长时间对 Agent 有研究和实操的文锋,想就这些问题展开一些讨论。 首先我想问,到底怎么定义 Agent? 文锋: 我认为最好的就是 Anthropic 的定义:Agent 是让模型基于环境反馈去使用工具的一个程序。 曲凯: 那你怎么看最近这波 Agent 热? 文锋: 这波 Agent 跟过去非常不一样。 之所以会有这种跃迁,一是因为底层模型能力有了很大的进步,尤其是在结合了 RL 之后,以 o1 为代表的模型还赋予了 Agent 长思维能力。 二是因为 Agent 的工程侧和产品侧也有很大的突破,主要表现就是大家更知道该怎么给 Agent 构建一个合适的 Context,从而更好地解决问题了。 曲凯: 怎么理解这个 Context? 文锋: ...
Manus估值36亿了?
投中网· 2025-04-27 06:35
将投中网设为"星标⭐",第一时间收获最新推送 硅谷顶级VC也来投了。 作者丨 刘燕秋 来源丨 投中网 模型推理能力的显著提升,使得 Agent 成为 2025 年最热的 AI 投资方向,在这波热潮中, Manus 成为第一个在国内刷屏的 Agent ,甚至可以说开 启了 Agent 元年。 这家公司最近又有新动向。据外媒援引知情人士消息, Manus AI 背后的公司 " 蝴蝶效应 " 获得了由美国风投 Benchmark 领投的一轮融资,融资金 额达 7500 万美元(约合 5.46 亿人民币)。此前M anus 已从腾讯、真格基金和红杉中国等投资人那里筹集了超过 1000 万美元。这轮融资让 Manus AI 的估值增长了约 5 倍,提升至近 5 亿美元(约合 36.44 亿人民币)。 我拿这条信息跟 Manus 团队求证,截至发稿暂无回应。 今年 3 月, Manus 发布了一款尚在内测中的通用 AI Agent ,能够独立处理简历筛选、行程规划和股票分析等任务,并声称在多项指标上的表现均优 于 OpenAI 近期推出的 Deep Research 。最近它还推出了订阅服务,价格为每月 39 美元,高级 ...
Windsurf团队科普Agent:不是什么都叫智能体!
Founder Park· 2025-04-25 13:29
Windsurf 团队的联合创始人 Anshul Ramachandran 最近发布了一篇关于 Agent 的科普文章,对于现下被广泛讨论,且经常被误用混淆的各种 Agent 概念 进行了辨析,同时对 Agent 系统的核心构成进行了拆解。如果你想要通过一篇全面地了解关于 Agent 的基础情况,这是一篇相当不错的资料。 以下为《What is an Agent?》全文内容,Founder Park 进行了编译和适当的调整。 Founder Park 正在搭建开发者社群,邀请积极尝试、测试新模型、新技术的开发者、创业者们加入,请扫码详细填写你的产品/项目信息,通过审核 后工作人员会拉你入群~ 进群之后,你有机会得到: 欢迎来到 2025 年,这一年 「Agent」 一词的使用频率极高,其含义也变得相当宽泛。在日常交流中,人们基于各自的理解 confidenty 地使用这 个词,反而使其原本清晰的含义逐渐模糊。 如果你是一名开发者,正在构建与 Agent 相关的解决方案,那么本文可能并不适合你。本文更适合以下几类人群: 在会议、讨论或日常对话中听到他人提及 AI Agent 时心存疑惑的朋友,或许你对 Agen ...
人工智能行业专题:大厂Agent来临,MCP拓宽应用边界
Guoxin Securities· 2025-04-24 07:52
Investment Rating - The report maintains an "Outperform" rating for the industry [1][37]. Core Insights - The emergence of general-purpose AI agents, such as ByteDance's "Kouzi Space," marks the beginning of competition among major tech companies, with expectations for rapid advancements from Alibaba and Tencent [2][11]. - The development of Model Context Protocol (MCP) is anticipated to standardize AI applications, enhancing the capabilities of AI agents and accelerating ecosystem expansion [8][11]. - The report emphasizes the potential of AI agents to redefine human-machine collaboration, providing new avenues for AI application development [33]. Summary by Sections ByteDance: Launch of General-Purpose Agent - ByteDance's "Kouzi Space" allows users to interact with AI agents for task completion, featuring a dual mode for exploration and planning [4][11]. - The platform supports the integration of MCP, expanding the capabilities of AI agents and facilitating the addition of various plugins [8][11]. Zhipu: Full-Stack Self-Development and Open Source - Zhipu's AutoGLM "Meditation" model showcases advanced research and operational capabilities, achieving state-of-the-art performance in multiple testing environments [15][19]. - The model's open-source approach is expected to foster ecosystem growth and accelerate application scenarios [20]. Genspark: Integration of Multiple AI Models for Accurate Responses - Genspark's Super Agent utilizes a mixed-agent system, integrating over 80 tools and 10 advanced datasets to enhance task execution efficiency [28][31]. - The platform has demonstrated superior performance in benchmark tests compared to other leading AI products [24][28]. Investment Recommendations - The report suggests that the development of AI agents opens new paradigms for human-machine collaboration, with a positive outlook on the future of AI applications [2][33].
Deep Research类产品深度测评:下一个大模型产品跃迁点到来了吗?
Founder Park· 2025-04-23 12:37
以下文章来源于海外独角兽 ,作者拾象 Founder Park 正在搭建开发者社群,邀请积极尝试、测试新模型、新技术的开发者、创业者们加入,请扫码详细填写你的产品/项目信息,通过 审核后工作人员会拉你入群~ 海外独角兽 . 研究科技大航海时代的伟大公司。 Deep Research 产品可被理解为 一个以大模型能力为基础、集合了检索与报告生成的端到端系统,对信息进行迭代搜索和分析,并生成详细报告作为输 出。 参考 Han Lee 的 2x2 分析框架,目前 Deep Research 类产品在 输出深度、训练程度 两大维度呈现分异。 输出深度 即产品在先前研究成果的基础上进行了 多少次迭代循环以收集更多信息,可进一步被理解为 Agentic 能力的必要基础。 低训练程度 指代经过人工干预和调整的系统,比如使用人工调整的 prompt,高训练程度则是指利用机器学习对系统进行训练。 和传统 LLM Search 产品相比,Deep Research 是迈向 Agent 产品雏形的一次跃迁,可能也将成为具有阶段代表性的经典产品形态。 Deep Research 产品通过系列推理模型嵌入,已生长出了 Agent 产品 ...
Agents和Workflows孰好孰坏,LangChain创始人和OpenAI杠上了
Founder Park· 2025-04-21 12:23
但 LangChain 创始人 Harrison Chase 对于 OpenAI 在文中的一些观点持有异议,尤其是「通过 LLMs 来主导 Agent」的路线,迅速发表了一篇长文回 应。 Harrison Chase 认为,并非要通过严格的「二元论」来区分 Agent,目前我们看到大多数的「Agentic 系统」都是 Workflows 和 Agents 的结合。理想 的 Agent 框架应该允许从「结构化工作流」逐步过渡到「由模型驱动」,并在两者之间灵活切换。 相比 OpenAI 的文章,Harrison Chase 更认同 Anthropic 此前发布的如何构建高效 Agents 的文章,对于 Agent 的定义,Anthropic 提出了「Agentic 系 统」的概念,并且把 Workflows 和 Agents 都看作是其不同表现形式。 总的来说, 这是大模型派(Big Model)和工作流派(Big Workflow)的又一次争锋, 前者认为每次模型升级都可能让精心设计的工作流瞬间过 时,这种「苦涩的教训」让他们更倾向于构建通用型、结构最少的智能体系统。而以 LangGraph 为代表的后者,强调 ...