Headless-Browser-Automatisierungs-CLI für KI-Agenten mit Accessibility-Tree-Snapshots und ref-basierter Elementauswahl.
npx clawhub@latest install agent-browser-clawdbotAgent Browser ist ein Headless-Browser-Automatisierungs-CLI, das speziell für KI-Agenten entwickelt wurde. Anstatt auf Pixelkoordinaten oder CSS-Selektoren zu setzen, stellt es einen Accessibility-Tree-Snapshot mit stabilen @ref-Bezeichnern bereit, wodurch Elementinteraktionen deterministisch und zuverlässig werden. Es unterstützt mehrstufige Workflows, isolierte Browser-Sitzungen, Netzwerk-Mocking, Zustandspersistenz und eine vollständige Palette an Seiteninteraktionen – alles über ein übersichtliches, JSON-freundliches CLI.
npx clawhub@latest install agent-browser-clawdbotKlicke oben auf der Seite auf Installieren für die Ein-Klick-Einrichtung
Anstatt fragiler CSS-Selektoren oder Koordinaten erfasst Agent Browser den Zugänglichkeitsbaum und weist jedem Element stabile @ref-IDs zu (z. B. @e2). KI-Agenten lesen diese Refs aus der JSON-Ausgabe und verwenden sie für alle nachfolgenden Interaktionen, was eine zuverlässige Zielansteuerung auch bei dynamischen Seitenaktualisierungen gewährleistet.
Unterstützt Klicken, Ausfüllen, Tippen, Hovern, Aktivieren/Deaktivieren, Auswählen, Ziehen, Scrollen, Drücken und mehr – alles ref-gesteuert. Bietet außerdem get- und is-Befehle zum Extrahieren von Text, HTML und Attributen sowie zum Überprüfen von Sichtbarkeit oder aktiviertem Zustand.
Führen Sie mehrere benannte Sitzungen gleichzeitig mit --session <name> aus. Jede Sitzung pflegt ihren eigenen Browser-Kontext und ermöglicht so Szenarien wie das gleichzeitige Testen von Administrator- und Benutzerrollen, ohne dass Cookies oder Zustände übertragen werden.
Speichere Cookies und Local Storage mit state save in einer JSON-Datei und lade sie später mit state load wieder, um Login-Abläufe vollständig zu überspringen — ideal für wiederholte Automatisierungsläufe.
Blockiere unerwünschte Anfragen (z. B. Werbung), simuliere API-Antworten und überprüfe die Netzwerkaktivität – alles über die CLI. Nützlich für Tests und Scraping ohne externe Störungen.
Warten auf Elemente, Textinhalte, URL-Muster, Netzwerk-Leerlauf oder beliebige JavaScript-Bedingungen. Sorgt für stabile Snapshots, bevor der Agent mit dem nächsten Schritt fortfährt.
Ein KI-Agent navigiert zu einer Suchmaschine, füllt eine Suchanfrage über ein ref-identifiziertes Eingabefeld aus, wartet auf die Ergebnisse und extrahiert anschließend Text und Links aus den Ergebniselementen – alles ohne Screenshots oder manuelles Anpassen von Selektoren.
Zwei gleichzeitige Sitzungen – eine als Administrator authentifiziert, eine als regulärer Benutzer – interagieren gleichzeitig mit derselben App. Jede Sitzung lädt ihren eigenen gespeicherten Authentifizierungsstatus und ermöglicht so eine parallele Workflow-Validierung.
Ein Agent meldet sich einmal an, speichert den Sitzungsstatus in auth.json und lädt diesen Status bei nachfolgenden Ausführungen, um die Anmeldung zu überspringen — und fährt dann direkt mit dem Ausfüllen und Absenden von Formularen fort.
Bei komplexen React- oder Vue-Apps erstellt der Agent nach jeder Navigation oder Zustandsänderung einen neuen Snapshot und arbeitet dabei stets mit einem aktuellen Accessibility-Tree, um sicherzustellen, dass alle Referenzen vor der Interaktion auf dem neuesten Stand sind.
npx clawhub@latest install agent-browser-clawdbotAnmelden, um eine Bewertung zu schreiben
Noch keine Bewertungen. Sei der Erste, der seine Erfahrungen teilt!