Snabb Rust-baserad headless browser-automatiserings-CLI med Node.js-reserv för AI-agenter att navigera, klicka, skriva och ta ögonblicksbilder.
npx clawhub@latest install agent-browserAgent Browser är ett snabbt, headless CLI-verktyg för webbläsarautomatisering byggt i Rust (med Node.js som reservalternativ) och utformat specifikt för AI-agenter. Det låter agenter navigera till URL:er, interagera med sidelement med hjälp av stabila @ref-identifierare, extrahera strukturerad data, ta skärmdumpar, spela in video och hantera sessioner — allt via enkla, kompostbara skalkommandon. Oavsett om du automatiserar formulärinlämningar, skrapar dynamiskt innehåll eller testar webbanvändargränssnitt erbjuder Agent Browser ett konsekvent, skriptbart gränssnitt mot verkligt webbläsarbeteende.
npx clawhub@latest install agent-browserKlicka på Installera-knappen längst upp på sidan för installation med ett klick
Kör agent-browser snapshot -i för att få en lista över alla interaktiva element med stabila @ref-identifierare (t.ex. @e1, @e2). Använd dessa refs direkt i efterföljande klick-, fyll-, hovra- eller hämta-kommandon — inga CSS-väljare eller XPath krävs.
Stöder klick, dubbelklick, fokus, fyll i, skriv, tangentbordstryckning/-håll/-släpp, hovring, kryssruta markera/avmarkera, rullgardinsmeny val, dra och släpp, filuppladdning och rullning — vilket täcker nästan alla användarinteraktioner som en webbläsare stöder.
Spara autentiserat webbläsartillstånd (cookies, lagring) till en JSON-fil med agent-browser state save, och ladda sedan om det i framtida sessioner för att hoppa över återautentisering. Parallella isolerade sessioner via --session <name> möjliggör flera samtidiga webbläsarkontexter.
Ta skärmbilder av hela sidor, spara sidor som PDF-filer eller spela in webbläsarinteraktioner som .webm-videofiler. Inspelning bevarar cookies och lagring från den aktuella sessionen, vilket gör det idealiskt för att skapa reproducerbara demonstrationer.
Avlyssna, blockera eller mocka HTTP-förfrågningar med agent-browser network route. Filtrera och inspektera spårade förfrågningar för att felsöka API-anrop eller simulera offline-/feltillstånd under testning.
När refs inte är tillgängliga, använd semantiska lokaliserare för att hitta element via ARIA-roll, synlig text, etikett eller CSS-väljare — till exempel agent-browser find role button click --name "Submit" eller agent-browser find text "Sign In" click.
En AI-agent öppnar en mål-URL, tar en ögonblicksbild av sidan för att identifiera formulärfält via ref, fyller i varje fält med agent-browser fill, skickar in formuläret med ett klick, väntar sedan tills nätverket är inaktivt och tar en ny ögonblicksbild för att bekräfta att det lyckades — allt utan att en människa behöver vara inblandad.
Logga in en gång interaktivt, spara sessionen med agent-browser state save auth.json och läs in den på nytt i alla framtida agentkörningar. Detta undviker upprepade inloggningsflöden och håller autentiseringsuppgifter utanför automatiseringsskript.
Navigera till en JavaScript-renderad sida, kör agent-browser snapshot för att fånga hela tillgänglighetsträdet och använd sedan kommandona agent-browser get text eller agent-browser get attr för att extrahera strukturerat innehåll som en vanlig HTTP-skrapare skulle missa.
Skripta en sekvens av webbläsarinteraktioner med Agent Browser, ta skärmdumpar eller en videoinspelning vid varje steg och exportera en PDF av slutstatus — vilket ger QA-pipelines visuella bevis på förväntat beteende över flera testkörningar.
npx clawhub@latest install agent-browserLogga in för att skriva en recension
Inga recensioner ännu. Var den första att dela din upplevelse!