자연어 명령으로 웹 브라우징을 자동화하세요 — CLI를 통해 탐색, 데이터 추출, 양식 작성 및 스크린샷 촬영이 가능합니다.
npx clawhub@latest install browser-automation요구 사항
Browser Automation을 사용하면 AI 에이전트가 간단한 CLI 인터페이스를 통해 일반 영어 명령으로 웹 브라우저를 제어할 수 있습니다. Stagehand와 Claude를 기반으로 하며, URL 탐색, 요소 클릭, 양식 작성, 구조화된 데이터 추출, 스크린샷 캡처를 지원합니다. 두 가지 모드로 작동합니다: 개발용 로컬 Chrome 브라우저, 또는 스텔스 모드와 CAPTCHA 처리 기능을 갖춘 프로덕션급 스크래핑을 위한 원격 Browserbase 환경 — 구성에 따라 자동으로 전환됩니다.
npx clawhub@latest install browser-automation이 페이지 상단의 설치 버튼을 클릭하면 원클릭으로 설정할 수 있습니다
browser act "click the Sign In button"와 같은 명령어를 사용하여 일반 영어로 브라우저 작업을 실행하세요. XPath나 CSS 선택자가 필요 없습니다 — Stagehand가 사용자의 의도를 해석하여 올바른 요소와 상호작용합니다.
이 스킬은 Browserbase API 키가 있는지 감지하여 자동으로 원격 Browserbase 환경으로 라우팅하거나, 없을 경우 로컬 Chrome 브라우저로 전환합니다. 수동 모드 전환이나 사용자 프롬프트가 필요하지 않습니다.
browser extract "<instruction>"을 선택적 JSON 스키마와 함께 사용하면 모든 페이지에서 특정 데이터를 추출할 수 있습니다. 이 스킬은 사용자가 정의한 형태로 데이터를 반환하므로, 이후 처리 과정이 간편해집니다.
browser screenshot을 사용하여 언제든지 현재 브라우저 상태를 캡처하세요. 이 기능은 다음 단계로 진행하기 전에 탐색이나 작업이 예상대로 완료되었는지 확인하는 데 특히 유용합니다.
액션이 실패하거나 페이지에 무엇이 있는지 확실하지 않을 때, browser observe "<query>"를 사용하면 사용 가능한 인터랙티브 요소들을 표시해 주어 — 정확한 후속 액션을 작성하는 데 도움이 됩니다.
원격 모드에서 Browserbase는 스텔스 브라우징, 프록시 지원, CAPTCHA 우회 기능을 제공하며, 이를 통해 Browser Automation 스킬은 프로덕션 스크래핑 파이프라인 및 봇 감지 기능이 있는 사이트에 적합합니다.
경쟁사 웹사이트를 탐색하고, 정의된 스키마로 가격표나 제품 목록을 추출한 후, 구조화된 결과를 분석 워크플로우에 입력하세요 — 커스텀 스크레이퍼를 작성할 필요 없이 Browser Automation으로 모두 처리할 수 있습니다.
에이전트가 웹 포털에 로그인하고, 양식으로 이동하여 자연어 액션을 사용해 필드를 입력한 후 제출하도록 합니다. API가 없는 반복적인 데이터 입력 작업을 자동화할 수 있습니다.
웹 애플리케이션을 배포한 후, Browser Automation 스킬을 사용하여 주요 페이지를 탐색하고 각 단계에서 스크린샷을 캡처하면 UI 정확성을 확인할 수 있는 시각적 감사 추적 기록을 얻을 수 있습니다.
안티봇 조치가 있는 사이트에서 데이터를 스크래핑하기 위해 Browserbase 모드로 Browser Automation 스킬을 실행하고, 스텔스 모드와 프록시 지원을 활용하여 대규모로 안정적으로 데이터를 수집합니다.
BROWSERBASE_API_KEY와 BROWSERBASE_PROJECT_ID 모두 필요합니다.npx clawhub@latest install browser-automation요구 사항
리뷰를 작성하려면 로그인
아직 리뷰가 없습니다. 첫 번째로 경험을 공유해 보세요!