透過自然語言指令自動化網頁瀏覽操作——透過 CLI 進行導覽、擷取資料、填寫表單及截圖。
npx clawhub@latest install browser-automation系統需求
Browser Automation 讓您的 AI 代理能夠透過簡單的 CLI 介面,使用純英文指令控制網頁瀏覽器。由 Stagehand 和 Claude 驅動,支援網址導覽、點擊元素、填寫表單、擷取結構化資料以及截圖功能。它支援兩種模式:用於開發的本機 Chrome 瀏覽器,以及用於生產級爬取的遠端 Browserbase 環境(具備隱匿模式與 CAPTCHA 處理功能)——並根據您的設定自動切換。
npx clawhub@latest install browser-automation點擊本頁頂部的 安裝 按鈕即可一鍵設定
使用 browser act "click the Sign In button" 等指令,以純英文發出瀏覽器操作命令。無需 XPath 或 CSS 選擇器——Stagehand 會解讀您的意圖,並與正確的元素進行互動。
此技能會偵測是否存在 Browserbase API 金鑰,並自動路由至遠端 Browserbase 環境,或退而使用本地 Chrome 瀏覽器。無需手動切換模式或提示使用者進行操作。
使用 browser extract "<instruction>" 並搭配可選的 JSON schema,從任何頁面中提取特定資料。此技能會依照您定義的結構回傳資料,讓後續處理更加簡便。
使用 browser screenshot 在任意時間點擷取當前瀏覽器狀態。這在繼續執行後續步驟前,用於驗證導航或操作是否已如預期完成時特別有用。
當操作失敗或您不確定頁面上有什麼內容時,browser observe "<query>" 會顯示可用的互動元素,幫助您制定精確的後續操作。
在遠端模式下,Browserbase 提供隱身瀏覽、代理支援以及 CAPTCHA 繞過功能,使 Browser Automation 適合用於生產環境的爬取流程以及具有機器人偵測機制的網站。
透過 Browser Automation 瀏覽競爭對手網站,以預定義的結構描述提取價格表或產品清單,並將結構化結果輸入分析工作流程——無需撰寫任何自訂爬蟲程式。
讓代理程式登入網頁入口網站、導航至表單、使用自然語言動作填寫欄位並提交,自動化處理那些缺乏 API 的重複性資料輸入任務。
在部署網頁應用程式後,使用 Browser Automation 技能瀏覽關鍵頁面,並在每個步驟截圖,為您提供視覺稽核記錄,以確認使用者介面的正確性。
在 Browserbase 模式下執行 Browser Automation 技能,以抓取具有反機器人防護措施的網站資料,透過隱匿模式與代理伺服器支援,穩定地大規模收集資料。
BROWSERBASE_API_KEY 與 BROWSERBASE_PROJECT_ID。npx clawhub@latest install browser-automation系統需求
登入後撰寫評價
尚無評價。來分享你的使用體驗吧!