CLI d'automatisation de navigateur headless rapide basé sur Rust avec repli Node.js, permettant aux agents IA de naviguer, cliquer, saisir et capturer des pages.
npx clawhub@latest install agent-browserAgent Browser est une CLI d'automatisation de navigateur headless rapide, construite en Rust (avec repli Node.js), conçue spécifiquement pour les agents IA. Elle permet aux agents de naviguer vers des URL, d'interagir avec des éléments de page via des identifiants @ref stables, d'extraire des données structurées, de capturer des captures d'écran, d'enregistrer des vidéos et de gérer des sessions — le tout via des commandes shell simples et composables. Que vous automatisiez la soumission de formulaires, le scraping de contenu dynamique ou les tests d'interfaces web, Agent Browser fournit une interface cohérente et scriptable vers le comportement réel du navigateur.
npx clawhub@latest install agent-browserCliquez sur le bouton Installer en haut de cette page pour une configuration en un clic
Exécutez agent-browser snapshot -i pour obtenir la liste de tous les éléments interactifs avec des identifiants @ref stables (ex. @e1, @e2). Utilisez ces refs directement dans les commandes suivantes de clic, remplissage, survol ou récupération — sans sélecteurs CSS ni XPath.
Prend en charge le clic, le double-clic, le focus, le remplissage, la saisie, les pressions/maintiens/relâchements de touches, le survol, la coche/décoche de cases, la sélection dans les listes déroulantes, le glisser-déposer, le téléchargement de fichiers et le défilement — couvrant pratiquement toutes les interactions utilisateur supportées par un navigateur.
Sauvegardez l'état authentifié du navigateur (cookies, stockage) dans un fichier JSON avec agent-browser state save, puis rechargez-le lors de sessions futures pour éviter la ré-authentification. Les sessions isolées parallèles via --session <name> permettent plusieurs contextes de navigateur simultanés.
Capturez des captures d'écran pleine page, enregistrez des pages en PDF, ou enregistrez les interactions du navigateur sous forme de fichiers vidéo .webm. L'enregistrement préserve les cookies et le stockage de la session actuelle, ce qui le rend idéal pour créer des démonstrations reproductibles.
Interceptez, bloquez ou simulez des requêtes HTTP avec agent-browser network route. Filtrez et inspectez les requêtes suivies pour déboguer les appels API ou simuler des états hors ligne ou d'erreur lors des tests.
Lorsque les refs ne sont pas disponibles, utilisez des localisateurs sémantiques pour trouver des éléments par rôle ARIA, texte visible, label ou sélecteur CSS — par exemple, agent-browser find role button click --name "Submit" ou agent-browser find text "Sign In" click.
Un agent IA ouvre une URL cible, prend un instantané de la page pour identifier les champs de formulaire par ref, remplit chaque champ avec agent-browser fill, soumet via un clic, attend l'inactivité réseau et prend un nouvel instantané pour confirmer le succès — sans intervention humaine.
Connectez-vous une seule fois de manière interactive, sauvegardez la session avec agent-browser state save auth.json, et rechargez-la lors de toutes les exécutions futures de l'agent. Cela évite les flux de connexion répétés et maintient les identifiants hors des scripts d'automatisation.
Naviguez vers une page rendue en JavaScript, exécutez agent-browser snapshot pour capturer l'arbre d'accessibilité complet, puis utilisez les commandes agent-browser get text ou agent-browser get attr pour extraire du contenu structuré qu'un scraper HTTP classique manquerait.
Scriptez une séquence d'interactions dans le navigateur, capturez des captures d'écran ou un enregistrement vidéo à chaque étape, et exportez un PDF de l'état final — offrant aux pipelines QA une preuve visuelle du comportement attendu à chaque exécution de test.
npx clawhub@latest install agent-browserSe connecter pour écrire un avis
Aucun avis pour l'instant. Soyez le premier à partager votre expérience !