Workflow
Stagehand
icon
Search documents
X @Avi Chawla
Avi Chawla· 2025-07-12 18:56
RT Avi Chawla (@_avichawla)Finally, a browser automation framework for Agents that actually works in production (open-source)!Typical browser automation tools like Selenium or Playwright require you to hard-code automation. These are brittle since one change in the website can disrupt the full workflow.On the other hand, high-level Agents like OpenAI Operator can be unpredictable in production.Stagehand is an open-source framework that bridges the gap between:- brittle traditional automation like Playwright ...
X @Avi Chawla
Avi Chawla· 2025-07-12 06:30
Key Features of Stagehand - Bridges the gap between brittle traditional automation tools like Playwright and Selenium, and unpredictable full-agent solutions like OpenAI Operator [1][3] - Employs AI for navigating unfamiliar pages and code (Playwright) for executing known tasks [3] - Allows previewing AI actions before execution [3] - Caches repeatable actions to conserve tokens [3] - Compatible with SOTA computer use models with minimal code [3] - Available in both Python and TypeScript SDK [3] Stagehand Ecosystem - Includes an open-source MCP server [2] - Aims to provide a browser automation framework for Agents suitable for production environments [1]
8 位华人团队的创意 AI 1200 万美金 ARR 正融资,给 AI Agent 的专属浏览器已 3 亿美金估值
投资实习所· 2025-04-22 04:50
伴随着 AI Agent 正逐渐成为应用层的核心产品形态,AI 时代的很多基础设施也在发生变化,之前介绍过的一个核心 针对 AI 而非人类构建的 AI 搜索 就是 这个需求逻辑《 又一 AI 搜索拿了 2200 万美金,但它是给 AI 构建的而非人类 》。 同理,AI Agent 时代可能也需要新的浏览器基础设施。随着 AI 的快速发展,尤其是大型语言模型(LLMs)的兴起,前 Twilio 员工 Paul Klein 意识到 AI Agent 在执行网页任务时对浏览器的需求日益增长,于是决定创建 Browserbase 这个为 AI Agent 量身定制的浏览器平台,很快成为投资人追逐的一个标 的。 仅过去一年时间,Browserbase 就完成了 3 轮融资,总计达到了 2750 万美金 ,投资人包括了 CRV、KP、AI Grant 以及 Okta Ventures 等。与此同时, 根据我了解到的最新消息, Browserbase 已经再次完成了新的 B 轮融资,估值达到了 3 亿美金,由 Notable Capital 领投 。 Browserbase 解决的问题很简单,就是让 AI 能够真正"使用" ...
为什么 AI Agent 需要自己的浏览器?
海外独角兽· 2025-04-08 11:05
编译:Xeriano 编辑:Cage 浏览器的使用者正在逐渐从人类用户转移到 AI Agent ,Agent 与互联网环境互动的底层设施也因此 正在变得越来越重要。传统浏览器无法满足 AI Agent 自动化抓取、交互和实时数据处理的需求。 Browserbase 的创始人 Paul Klein 早在 23 年底就敏锐地洞察到 AI Agent 亟需一个全新的交互载体 ——一个"为 AI 而生"的云端浏览器。这个浏览器不仅要解决现有工具的性能和部署问题,更核心的 是要利用 LLM 和 VLM 赋予浏览器理解和适应网页变化的能力,让 AI Agent 能用更接近自然语言的 方式与之交互,稳定地完成任务。 Browserbase 是一家成立一年多的 headless browser 服务提供商,以云服务的形式为 AI Agent 公司提 供 scalable、高可用性的浏览器服务。近期,Browserbase 又推出了 StageHand,一种利用 LLM 使得 开发者可以用自然语言与网页进行交互的框架,进一步拓展了其在 headless browser 领域的影响。 本文基于创始人早期备忘录进行了编译,详细阐述 ...