Workflow
强化学习微调(RFT)
icon
Search documents
2025,AI Agent赛道还有哪些机会?
Hu Xiu· 2025-05-26 08:16
进入2025年以来, AI Agent的发展明显提速。5月6日,OpenAI宣布以30亿美元收购 Windsurf;编程工具Cursor的母公司Anysphere也获得了9亿美元的融 资,估值高达90亿美元;号称中国第一个通用AI Agent的Manus在五月也获得了硅谷老牌风险投资公司Benchmark领投的7500万美元的融资;OpenAI在一 月推出了具备自主使用浏览器能力的Operator,并在二月发布了专注于复杂任务处理的Deep Research,这两个产品上线后迅速获得关注,如今已有不少用 户成为其深度使用者。 这期文章我们就来聊聊:究竟是哪些关键能力,支撑了Agent的技术跃迁?哪一类Agent最有可能成为未来的通用Agent?而普通创业者目前在Agent赛道还 有哪些机会? 我们邀请了MindVerse心识宇宙的创始人陶芳波以及AI产品经理Kolento Hou,一起聊一聊AI Agent的核心技术、热门产品使用体验、创业机会与挑战,以 及AI Agent的未来将走向何方? 以下是这次对话内容的精选: 一、RTF推动的Agent热潮 泓君:首先请两位嘉宾来分享下自己最近使用Agent的频率是 ...
OpenAI揭秘Deep Research实现始末
锦秋集· 2025-04-30 07:09
与市面上多数"通用Agent"不同,OpenAI 的 Deep Research 从诞生那一刻起就被锁定在一件事上—— 通过强化 学习,将搜索、浏览、筛选与整合信息的能力内化为模型的原生技能,直接训练进参数里,而不是仅靠 Prompt工程和外部工程组合 。 那么,OpenAI 是如何把这套复杂技能训练进参数里的?他们在数据筹备、强化微调、安全与记忆管理上又摸 索出了哪些最佳实践? OpenAI Deep Research团队核心成员Isa Fulford最近在一个访谈中做了分享: 我们认为这个访谈提供了一个透视 OpenAI 构建旗舰智能体 Deep Research 的独特视角,并提供了一些开发实 践经验,因此锦秋基金( 微信公号锦秋集ID:jqcapital)对本文进行了编译。 01 Deep Research 的起源与目标 OpenAI 团队在强化学习算法刚刚显露锋芒时,放弃了订汉堡、订花那条看似容易衡量的交易型赛道, 转而攻克浏览与知识整合——他们认为整合知识是AGI 必不可少的前置技能, 也因为"纯读取"比"直接 下单"更安全。 数据的质量比数量更重要。 Deep Research 倾向"小而准": ...