自然言語コマンドでウェブブラウジングを自動化 — CLI経由でナビゲート、データ抽出、フォーム入力、スクリーンショット撮影が可能です。
npx clawhub@latest install browser-automation動作要件
Browser Automationを使用すると、AIエージェントがシンプルなCLIインターフェースを通じて、平易な英語のコマンドでウェブブラウザを操作できます。StagehandとClaudeを活用し、URLへのナビゲーション、要素のクリック、フォームへの入力、構造化データの抽出、スクリーンショットの取得をサポートしています。ローカルのChromeブラウザを使用する開発モードと、ステルスモードおよびCAPTCHA処理を備えた本番グレードのスクレイピング向けリモートBrowserbase環境の2つのモードで動作し、設定に基づいて自動的に切り替わります。
npx clawhub@latest install browser-automationこのページ上部のインストールボタンをクリックするとワンクリックでセットアップできます
browser act "click the Sign In button" のようなコマンドを使って、平易な英語でブラウザの操作を指示できます。XPathやCSSセレクターは不要です — Stagehandがあなたの意図を解釈し、正しい要素を操作します。
このスキルは、Browserbase APIキーが存在するかどうかを検出し、自動的にリモートのBrowserbase環境にルーティングするか、ローカルのChromeブラウザにフォールバックします。手動でのモード切り替えやユーザーへの確認は不要です。
browser extract "<instruction>" をオプションの JSON スキーマと組み合わせて使用することで、任意のページから特定のデータを取得できます。このスキルは指定した形式でデータを返すため、その後の処理が簡単になります。
browser screenshot を使用して、任意のタイミングで現在のブラウザの状態をキャプチャできます。これは、次の操作に進む前に、ナビゲーションやアクションが期待どおりに完了したことを確認する際に特に役立ちます。
アクションが失敗したとき、またはページの内容が不明なときは、browser observe "<query>" を使用することで、利用可能なインタラクティブな要素を表示できます — これにより、より正確な後続アクションを作成するのに役立ちます。
リモートモードでは、BrowserbaseはステルスブラウジングURL、プロキシサポート、およびCAPTCHAバイパスを提供します。これにより、Browser Automationはボット検出機能を持つサイトや本番環境のスクレイピングパイプラインに適したスキルとなります。
競合他社のウェブサイトをナビゲートし、定義されたスキーマで価格表や製品リストを抽出し、構造化された結果を分析ワークフローに送り込む — カスタムスクレイパーを書くことなく、すべてBrowser Automationで実現できます。
エージェントにウェブポータルへのログイン、フォームへの移動、自然言語アクションを使用したフィールドへの入力、そして送信を行わせ、APIが存在しない繰り返しのデータ入力タスクを自動化します。
Webアプリケーションをデプロイした後、Browser Automation スキルを使用して主要なページを順に移動し、各ステップでスクリーンショットを撮影することで、UIの正確性を確認するための視覚的な監査証跡を得ることができます。
Browser AutomationのスキルをBrowserbaseモードで実行し、アンチボット対策が施されたサイトからデータを収集します。ステルスモードとプロキシサポートを活用することで、大規模かつ安定的にデータを収集できます。
BROWSERBASE_API_KEYとBROWSERBASE_PROJECT_IDの両方が必要です。npx clawhub@latest install browser-automation動作要件
レビューを書くにはログイン
まだレビューはありません。最初の体験をシェアしましょう!