基於 Rust 的高速無頭瀏覽器自動化 CLI,支援 Node.js 回退,讓 AI 代理能夠透過結構化命令導航、點擊、輸入並截取頁面。
Agent Browser 是一款使用 Rust 構建(並提供 Node.js 備援方案)的快速無頭瀏覽器自動化命令列工具,專為 AI 智能體設計。它讓智能體能夠透過簡單、可組合的 Shell 命令導覽 URL、使用穩定的 @ref 識別碼與頁面元素互動、擷取結構化資料、捕捉截圖、錄製影片以及管理工作階段。無論是自動化表單提交、抓取動態內容,還是測試 Web UI,Agent Browser 都為真實瀏覽器行為提供了一致、可腳本化的介面。
npx clawhub@latest install agent-browser點擊本頁頂部的 安裝 按鈕即可一鍵設定
執行 agent-browser snapshot -i 取得所有具有穩定 @ref 識別碼(例如 @e1、@e2)的互動元素清單。在後續的點擊、填寫、懸停或取得命令中直接使用這些 ref——無需 CSS 選擇器或 XPath。
支援點擊、雙擊、聚焦、填寫、輸入、按鍵/按住/釋放、懸停、核取方塊勾選/取消勾選、下拉選取、拖放、檔案上傳和捲動——幾乎涵蓋瀏覽器支援的所有使用者互動。
使用 agent-browser state save 將已驗證的瀏覽器狀態(Cookie、儲存空間)儲存到 JSON 檔案,然後在未來的工作階段中重新載入以略過重新驗證。透過 --session <name> 實現並行隔離工作階段,允許同時執行多個瀏覽器內容。
捕捉全頁截圖、將頁面儲存為 PDF,或將瀏覽器互動錄製為 .webm 影片檔案。錄製會保留目前工作階段的 Cookie 和儲存空間,非常適合建立可重現的示範。
使用 agent-browser network route 攔截、封鎖或模擬 HTTP 請求。過濾和檢查已追蹤的請求,以偵錯 API 呼叫或在測試期間模擬離線/錯誤狀態。
當 ref 不可用時,使用語義定位器透過 ARIA 角色、可見文字、標籤或 CSS 選擇器尋找元素——例如,agent-browser find role button click --name "Submit" 或 agent-browser find text "Sign In" click。
AI 智能體開啟目標 URL,對頁面進行快照以透過 ref 識別表單欄位,使用 agent-browser fill 填寫每個欄位,透過點擊提交,然後等待網路閒置並重新快照以確認成功——全程無需人工介入。
以互動方式登入一次,使用 agent-browser state save auth.json 儲存工作階段,並在日後所有智能體執行時重新載入。這樣可以避免重複的登入流程,並將憑證排除在自動化腳本之外。
導覽至 JavaScript 渲染的頁面,執行 agent-browser snapshot 捕捉完整的無障礙樹,然後使用 agent-browser get text 或 agent-browser get attr 命令擷取一般 HTTP 爬蟲無法取得的結構化內容。
編寫一系列瀏覽器互動腳本,在每個步驟捕捉截圖或錄製影片,並匯出最終狀態的 PDF——為 QA 流水線提供跨測試執行的預期行為視覺證明。
登入後撰寫評價
尚無評價。來分享你的使用體驗吧!