Workflow
海外独角兽
icon
Search documents
OpenAI:computer use 处于 GPT-2 阶段,模型公司的使命是让 agent 产品化
海外独角兽· 2025-04-23 12:41
编译:haozhen, Cookie AI agent 并不是一个新概念,但从 2024 年到今天,agent 的行动能力和交互方式发生了质变,头部模型厂商也正在将 agentic 能力融入模型,agentic 能 力会成为今年模型竞赛的重点之一, tool use 作为 agent 最重要的能力,一直是头部 AI labs 非常关注的方向。上周,OpenAI 发布了新一代模型 o3, o3 有最丰富的 tool use 方式。 本文是对 OpenAI agent 团队访谈的编译,OpenAI agent 产品和工程负责人分享了 OpenAI 在 agent 开发与工具生态方面的技术细节,以及他们对开发 者实践的观察与见解。他们认为,受益于 CoT 与 tool use 的结合,agent 获取信息的方式已经发生了巨变,agent 的下一步是能够接入数百个工具,并 能够自主判断调用哪个工具并确定如何使用。此外,multi agent 系统的工作效率会更高,且具有更高的可控性和优化潜力。 我们判断, multi agent 系统会在今年有大的突破,vertical agent 会因此直接受益,在 compute ...
代码即界面:生成式 UI 带来设计范式重构
海外独角兽· 2025-04-22 11:03
作者:张昊然,Motiff 妙多 Co-Founder、副总裁 编辑:Cage 曾被专业设计师看成"玩具"的生成式 UI,如今正在和 vibe coding 一起改写开发和设计工作流,需求- >代码->设计的新工作流开始出现。本文回溯了这场演变:从早期「拼乐高」式的模板化设计,到 Claude Sonnet 3.5 更新开始模型有了创造力、直接写出高美感和风格化的前端代码,到如今 AI 展现 出理解并遵循特定"设计系统"的能力。 AI 设计的表达力和风格多样性这两个维度上实现了跃迁式进步,让我们开始期待未来有 AI-native 的 设计编辑器,设计中的 70%+ 工作由 AI 完成,类似设计领域的 Cursor 甚至 Devin。设计师的价值不 再是操作设计工具进行构建,而是回归设计本身进行更多的思考、呈现更多的创意方案、推进更高 质量的决策。 本文是一篇读者投稿,来自 Motiff 妙多的 Cofounder 昊然。他基于这两年打造 AI-native 设计工具的 经验,对 AI+设计领域的未来可能性进行了推演,尤其是如何在模型能力的飞速进展下对业务方向 和技术路线作出决策。相信来自优秀读者朋友的实践和观 ...
Deep Research 类产品深度测评:下一个大模型产品跃迁点到来了吗?
海外独角兽· 2025-04-21 13:13
作者:Krystal 编辑:penny Deep Research 产品可被理解为 一个以大模型能力为基础、集合了检索与报告生成的端到端系统,对 信息进行迭代搜索和分析,并生成详细报告作为输出。 参考 Han Lee 的 2x2 分析框架,目前 Deep Research 类产品在 输出深度、训练程度 两大维度呈现分 异。 输出深度 即产品在先前研究成果的基础上进行了多少次迭代循环以收集更多信息,可进一步被 理解为 Agentic 能力的必要基础。 低训练程度 指代经过人工干预和调整的系统,比如使用人工调整 的 prompt,高训练程度则是指利用机器学习对系统进行训练。 从 2024 年末问世的 Google Deep Research,到 2024 年 2 月以来密集发布的 OpenAI Deep Research、 Perplexity、xAI Deep Search、Manus,Deep Research 成为各家 Agent 产品角逐的白热化赛道。 和传统 LLM Search 产品相比,Deep Research 是迈向 Agent 产品雏形的一次跃迁,可能也将成为具 有阶段代表性的经典产品形态。 ...
B2B 场景下的 AI 客服,Pylon 能否成为下一个 Zendesk?
海外独角兽· 2025-04-18 11:16
编译:linlin, haina 海外独角兽原创编译 转载请注明 2. Customer Support是世界最大 SaaS 市场之一: Salesforce 从 Service Cloud (即工单系统)获得的 83 亿美元收入甚至超过了从 Sales Cloud 或 CRM 获得 的 75 亿美元收入。世界上最大的 SaaS 公司从其支持系统获得的收入最多,,这正是Pylon决定进入的领域。 3. B2B 沟通方式正在全渠道化: 增长最快的公司都是那些抓住新兴趋势并随之成长的公司。 对 Pylon 来说,这一趋势是 B2B 企业与客户沟通正在变得更 加 Omnichannel。 AI Customer Support 是我们持续关注的领域。客户关系管理直接影响 B2B 客户留存与拓展。然而现有工具多针对 B2C 场景,B2B 支持渠道尚不完 善。基于 B2B 复杂的 Customer Support 链条与产品需求,初创公司 Pylon 正在打造专为 B2B 企业全栈 Customer Support 团队设计的协同工作平台。 Pylon 也是我们从硅谷 founder 口中经常听到的名字。 Pylon ...
AI Agent 摩尔定律:每7个月能力翻倍,带来软件智能大爆炸
海外独角兽· 2025-04-11 11:03
AI Agent 领域也存在 scaling law,甚至还在加速。 2022 年 ChatGPT 刚发布时能够实现的代码任务差不多等同于人类耗时 30s 的任务,到今天, AI Agent 已经能够自主完成需要人类花费一个小时的 coding 任务。"任务长度"是一个相当直观地测量 AI Agent 能力变化的标准。 编译:haozhen 编辑:Siqi AI 独立研究机构 META 的数据分析发现,Agent 能够完成的任务长度正以指数级增长,大约每 7 个 月翻一倍,预计 2029 年 Agent 能够完成时长为 1 个工作月的任务。 有意思的是,最近这一趋势甚至还在加速,2024-2025 年 Agent 能完成的任务长度约每 4 个月翻一 倍,如果这种更快的趋势持续下去,Agent 可能在 2027 年就能完成长达一个月的任务。 本文是对 META、Forethought 和 AI Digest 研究对于 agent scaling law 的整理编译。AI 研究人员们认 为,AI scaling law 的终局是 AI agent 自主开发 AI agent,到了那个时候我们就会进入软件智能爆炸时 ...
为什么 AI Agent 需要自己的浏览器?
海外独角兽· 2025-04-08 11:05
编译:Xeriano 编辑:Cage 浏览器的使用者正在逐渐从人类用户转移到 AI Agent ,Agent 与互联网环境互动的底层设施也因此 正在变得越来越重要。传统浏览器无法满足 AI Agent 自动化抓取、交互和实时数据处理的需求。 Browserbase 的创始人 Paul Klein 早在 23 年底就敏锐地洞察到 AI Agent 亟需一个全新的交互载体 ——一个"为 AI 而生"的云端浏览器。这个浏览器不仅要解决现有工具的性能和部署问题,更核心的 是要利用 LLM 和 VLM 赋予浏览器理解和适应网页变化的能力,让 AI Agent 能用更接近自然语言的 方式与之交互,稳定地完成任务。 Browserbase 是一家成立一年多的 headless browser 服务提供商,以云服务的形式为 AI Agent 公司提 供 scalable、高可用性的浏览器服务。近期,Browserbase 又推出了 StageHand,一种利用 LLM 使得 开发者可以用自然语言与网页进行交互的框架,进一步拓展了其在 headless browser 领域的影响。 本文基于创始人早期备忘录进行了编译,详细阐述 ...
Exa:给 AI Agent 的 “Bing API”
海外独角兽· 2025-04-07 12:09
作者:yongxin 编辑:Siqi Agentic AI 的 3 要素是:tool use,memory 和 context,围绕这三个场景会出现 agent-native Infra 的 机会。 01 . 为什么 Search API 很重要 按照场景和信息需求类型,搜索行为大致可以被分为四类: • 第一类,高频快速查询, 指的是一两步内就能完成的查询。Google 大部分的 query 还是以几个单词为 主,用户得到答案后马上离开,不会进行深入的查询。对于这类查询 Google、Bing 还是最好的应用,新 玩家几乎没有挑战的机会。 • 第二类,研究性质的深入查询, 用户可以和搜索工具反复交流,获取知识。这一类搜索是 LLM 和 LRM 带来的新场景,对应的代表性产品形态分别是 Chatbot 和 Deep research。 Agent 所获取到的信息质量是 agent 推理的起点,虽然 LLM 带来了 perplexity 为代表的 AI answer engine,提供了完全不同于传统搜索引擎的体验,但这些产品仍旧面向的是人类用户,产品逻辑是围 绕人类行为设计的。 在我们 MCP 的研究中发现, ...
Cartesia: 3 个月融资 9100 万美元,从 Transformer 到 Mamba 重塑语音 AI
海外独角兽· 2025-04-03 12:04
作者:linlin 编辑:haina 2025 年 3 月 11 日,语音生成初创公司 Cartesia 宣布完成 6400 万美元 A 轮融资,距其 2700 万美元种 子轮融资仅过去不到 3 个月。本轮融资由 Kleiner Perkins 领投,Lightspeed、Index、A*、Greycroft、 Dell Technologies Capital 和 Samsung Ventures 等跟投。Cartesia 还同时推出了其旗舰产品 Sonic 2.0, 系统延迟从 90 毫秒缩短至 45 毫秒,为语音 AI 领域高效、实时且低成本的多模态交互提供了新动 力。 Cartesia 的核心团队均来自 Stanford AI labs,包括 Karan Goel、Albert Gu、Arjun Desai、Brandon Yang 四位校友及其共同导师 Chris Ré。团队共同的研究方向在于 SSM(状态空间模型)。从 S4 到 Mamba 的 SSM 系列研究,以线性时间复杂度,为解决 LLMs 主流架构 Transformer 在上下文长度的 固有局限提供了潜在解决方案,意味着更快的生成速度、 ...