Agent Browser

Name: Agent Browser
Author: TheSethRose

基於 Rust 的高速無頭瀏覽器自動化 CLI，支援 Node.js 回退，讓 AI 代理能夠透過結構化命令導航、點擊、輸入並截取頁面。

作者 TheSethRosev1.0.0

正在連線至智能體...

npx clawhub@latest install agent-browser

1.0k目前安裝數

957累計安裝數

v1.0.0版本

查看原始碼(ClawHub)

Agent Browser 技能概述

Agent Browser 是一款使用 Rust 構建（並提供 Node.js 備援方案）的快速無頭瀏覽器自動化命令列工具，專為 AI 智能體設計。它讓智能體能夠透過簡單、可組合的 Shell 命令導覽 URL、使用穩定的 @ref 識別碼與頁面元素互動、擷取結構化資料、捕捉截圖、錄製影片以及管理工作階段。無論是自動化表單提交、抓取動態內容，還是測試 Web UI，Agent Browser 都為真實瀏覽器行為提供了一致、可腳本化的介面。

如何使用

Step 1: 在終端機執行或在 AgentCellar 上安裝此技能

npx clawhub@latest install agent-browser

或

點擊本頁頂部的安裝按鈕即可一鍵設定

When to Use Agent Browser

Best Fit

自動化 Web 互動 — 您需要 AI 智能體在真實網站上導覽頁面、點擊按鈕、填寫表單或執行多步驟工作流程。
擷取結構化資料 — 您希望對頁面的無障礙樹或 DOM 進行快照，以從動態 JavaScript 渲染內容中提取文字、屬性或元素數量。
以程式方式填寫表單 — 您正在作為自動化流水線的一部分提交登入表單、搜尋查詢或多欄位表單。
測試 Web UI — 您需要輕量級、CLI 驅動的瀏覽器測試，支援截圖、PDF 匯出或互動錄製影片。

When Not to Use

靜態 HTML 抓取 — 如果目標頁面是純 HTML 且不含 JavaScript，使用更輕量的 HTTP 用戶端或 HTML 解析器會更快、更簡單。
大規模高並行爬取 — Agent Browser 針對循序智能體工作流程進行了最佳化，並非用於同時跨數千個 URL 的分散式網路爬取。

核心功能

透過無障礙快照進行基於 Ref 的元素定位

執行 agent-browser snapshot -i 取得所有具有穩定 @ref 識別碼（例如 @e1、@e2）的互動元素清單。在後續的點擊、填寫、懸停或取得命令中直接使用這些 ref——無需 CSS 選擇器或 XPath。

全面的互動命令

支援點擊、雙擊、聚焦、填寫、輸入、按鍵/按住/釋放、懸停、核取方塊勾選/取消勾選、下拉選取、拖放、檔案上傳和捲動——幾乎涵蓋瀏覽器支援的所有使用者互動。

工作階段管理與儲存狀態

使用 agent-browser state save 將已驗證的瀏覽器狀態（Cookie、儲存空間）儲存到 JSON 檔案，然後在未來的工作階段中重新載入以略過重新驗證。透過 --session <name> 實現並行隔離工作階段，允許同時執行多個瀏覽器內容。

截圖、PDF 匯出和影片錄製

捕捉全頁截圖、將頁面儲存為 PDF，或將瀏覽器互動錄製為 .webm 影片檔案。錄製會保留目前工作階段的 Cookie 和儲存空間，非常適合建立可重現的示範。

網路攔截與請求模擬

使用 agent-browser network route 攔截、封鎖或模擬 HTTP 請求。過濾和檢查已追蹤的請求，以偵錯 API 呼叫或在測試期間模擬離線/錯誤狀態。

作為 Ref 替代方案的語義定位器

當 ref 不可用時，使用語義定位器透過 ARIA 角色、可見文字、標籤或 CSS 選擇器尋找元素——例如，agent-browser find role button click --name "Submit" 或 agent-browser find text "Sign In" click。

使用情境

自動化表單提交流程

AI 智能體開啟目標 URL，對頁面進行快照以透過 ref 識別表單欄位，使用 agent-browser fill 填寫每個欄位，透過點擊提交，然後等待網路閒置並重新快照以確認成功——全程無需人工介入。

使用可重複使用工作階段狀態進行身分驗證

以互動方式登入一次，使用 agent-browser state save auth.json 儲存工作階段，並在日後所有智能體執行時重新載入。這樣可以避免重複的登入流程，並將憑證排除在自動化腳本之外。

動態頁面資料擷取

導覽至 JavaScript 渲染的頁面，執行 agent-browser snapshot 捕捉完整的無障礙樹，然後使用 agent-browser get text 或 agent-browser get attr 命令擷取一般 HTTP 爬蟲無法取得的結構化內容。

帶有視覺產物的 UI 迴歸測試

編寫一系列瀏覽器互動腳本，在每個步驟捕捉截圖或錄製影片，並匯出最終狀態的 PDF——為 QA 流水線提供跨測試執行的預期行為視覺證明。

正在連線至智能體...

npx clawhub@latest install agent-browser

1.0k目前安裝數

957累計安裝數

v1.0.0版本

查看原始碼(ClawHub)

常見問題

評價

0 則評價

登入後撰寫評價

尚無評價。來分享你的使用體驗吧！