アクセシビリティツリーのスナップショットとrefベースの要素選択を使用した、AIエージェント向けのヘッドレスブラウザ自動化CLIツールです。
npx clawhub@latest install agent-browser-clawdbotAgent Browser は、AIエージェント専用に構築されたヘッドレスブラウザ自動化CLIです。ピクセル座標やCSSセレクターに依存する代わりに、安定した @ref 識別子を持つアクセシビリティツリーのスナップショットを公開することで、要素の操作を決定論的かつ信頼性の高いものにします。マルチステップワークフロー、独立したブラウザセッション、ネットワークモッキング、状態の永続化、そして幅広いページ操作をサポートしており、これらすべてがクリーンなJSONフレンドリーなCLIを通じて利用できます。
npx clawhub@latest install agent-browser-clawdbotこのページ上部のインストールボタンをクリックするとワンクリックでセットアップできます
不安定なCSSセレクターや座標の代わりに、Agent Browserはアクセシビリティツリーをキャプチャし、各要素に安定した@ref ID(例:@e2)を割り当てます。AIエージェントはJSONの出力からこれらの参照を解析し、以降のすべての操作に使用することで、動的なページ更新が発生しても確実なターゲット指定を実現します。
クリック、入力、タイプ、ホバー、チェック/チェック解除、選択、ドラッグ、スクロール、キー押下など、すべてref駆動の操作をサポートします。また、テキスト、HTML、属性の取得や、表示状態・有効状態の確認を行う get および is コマンドも提供します。
--session <name> を使用して、複数の名前付きセッションを同時に実行します。各セッションは独自のブラウザコンテキストを維持するため、クッキーや状態の混入なしに、管理者ユーザーと一般ユーザーのロールを並行してテストするといったシナリオが実現できます。
state save でCookieとローカルストレージをJSONファイルに保存し、後から state load で読み込むことでログインフローを完全にスキップできます — 繰り返しの自動化実行に最適です。
不要なリクエスト(広告など)をブロックし、APIレスポンスをモックし、ネットワークアクティビティを検査する — すべてCLIから実行可能です。外部の干渉なしにテストやスクレイピングを行う際に役立ちます。
要素、テキストコンテンツ、URLパターン、ネットワークのアイドル状態、または任意のJavaScript条件を待機します。エージェントが次のステップに進む前に、安定したスナップショットを確保します。
AIエージェントが検索エンジンに移動し、refで識別された入力フィールドにクエリを入力し、結果が表示されるまで待機した後、結果要素からテキストとリンクを抽出します。スクリーンショットや手動でのセレクター調整は一切不要です。
2つの同時セッション(一方は管理者として認証済み、もう一方は一般ユーザー)が同じアプリに同時にアクセスします。各セッションはそれぞれ保存済みの認証状態を読み込み、並行したワークフローの検証を可能にします。
エージェントが一度ログインし、セッション状態を auth.json に保存します。その後の実行時にはその状態を読み込んでログインをスキップし、直接フォームの入力と送信を行います。
複雑なReactやVueアプリに対して、Agent Browserはナビゲーションや状態変化のたびに再スナップショットを取得し、操作前に参照が最新であることを確認するため、常に新鮮なアクセシビリティツリーをもとに動作します。
npx clawhub@latest install agent-browser-clawdbotレビューを書くにはログイン
まだレビューはありません。最初の体験をシェアしましょう!