通过自然语言命令自动化网页浏览操作——通过 CLI 实现导航、数据提取、表单填写和截图功能。
npx clawhub@latest install browser-automation系统要求
Browser Automation 让您的 AI 智能体通过简单的 CLI 界面使用纯英文命令控制网页浏览器。它由 Stagehand 和 Claude 提供支持,支持导航 URL、点击元素、填写表单、提取结构化数据以及捕获截图。它支持两种模式:用于开发的本地 Chrome 浏览器,或用于生产级抓取的远程 Browserbase 环境(具备隐身模式和验证码处理功能)——并根据您的配置自动切换。
npx clawhub@latest install browser-automation点击本页顶部的 安装 按钮即可一键设置
使用自然语言发出浏览器操作指令,例如 browser act "click the Sign In button"。无需 XPath 或 CSS 选择器——Stagehand 会理解您的意图并与正确的元素进行交互。
该技能会检测是否存在 Browserbase API 密钥,并自动路由至远程 Browserbase 环境,或回退至本地 Chrome 浏览器。无需手动切换模式或提示用户进行操作。
使用 browser extract "<instruction>" 并配合可选的 JSON schema,从任意页面中提取特定数据。该技能按照您定义的结构返回数据,使后续处理更加简便。
使用 browser screenshot 随时捕获当前浏览器状态。这对于在继续操作之前验证导航或操作是否按预期完成尤为有用。
当某个操作失败或您不确定页面上有哪些内容时,browser observe "<query>" 会显示当前可用的交互元素,帮助您制定精确的后续操作。
在远程模式下,Browserbase 提供隐身浏览、代理支持以及 CAPTCHA 绕过功能——使 Browser Automation 技能适用于生产级抓取流水线以及具有机器人检测机制的网站。
浏览竞争对手网站,使用定义好的模式提取定价表或产品列表,并将结构化结果输入分析工作流——无需编写自定义爬虫,一切通过 Browser Automation 即可完成。
让智能体登录网页门户,导航至表单,使用自然语言操作填写字段并提交——自动化那些缺乏 API 支持的重复性数据录入任务。
部署 Web 应用程序后,使用 Browser Automation 技能导航关键页面并在每个步骤截图,为您提供可视化审计跟踪,以确认界面显示的正确性。
在 Browserbase 模式下运行 Browser Automation 技能,从具有反爬虫措施的网站抓取数据,利用隐身模式和代理支持,可靠地大规模采集数据。
BROWSERBASE_API_KEY 和 BROWSERBASE_PROJECT_ID。npx clawhub@latest install browser-automation系统要求
登录后撰写评价
暂无评价。来分享你的使用体验吧!