Pixelperfekt skrivbordsautomatisering med mus, tangentbord, skärmdump, fönsterhantering och urklippskontroll.
npx clawhub@latest install desktop-controlDesktop Control är en omfattande skicklighet för skrivbordsautomatisering som ger AI-agenter exakt, programmatisk kontroll över hela skrivbordsmiljön. Den täcker musrörelser (inklusive mjuka bezier-kurvebanor), tangentbordsinmatning med konfigurerbar hastighet, skärmdumpar och bildigenkänning, fönsterhantering samt urklippsoperationer. Byggd på PyAutoGUI och OpenCV innehåller den säkerhetsmekanismer som failsafe-hörn och godkännandeläge för att hålla automatiseringen under din kontroll.
npx clawhub@latest install desktop-controlKlicka på Installera-knappen längst upp på sidan för installation med ett klick
Flytta markören till absoluta skärmkoordinater eller relativa förskjutningar, med valfria mjuka bezier-kurvebanor som efterliknar naturliga mänskliga rörelser. Stöder vänster-, höger- och mittenklick, dubbel-/trippelklick, dra och släpp samt både vertikal och horisontell rullning.
Skriv text i valfri hastighet från omedelbar till mänsklig WPM, kör flerknappsgentvägar (Ctrl+C, Win+R, etc.), tryck på special- och funktionstangenter, och håll manuellt ned eller släpp modifieringstangenter för komplexa interaktioner som val av flera filer.
Fånga hela skärmen eller ett valfritt rektangulärt område och spara resultatet som en PNG. Använd valfritt OpenCV för att lokalisera en mallbild var som helst på skärmen med ett konfigurerbart konfidenströskel, vilket möjliggör elementdetektering utan hårdkodade koordinater.
Lista alla öppna fönster, aktivera valfritt fönster via partiell titelmatchning, hämta det aktuella fokuserade fönstret och läs av fönstrets position, storlek och titel — vilket gör det enkelt att orkestrera arbetsflöden med flera applikationer.
Ett felsäkert läge avbryter automatiseringen när musen når något hörn av skärmen. Ett godkännandeläge begär användarbekräftelse innan varje åtgärd. Gränskontroll förhindrar operationer utanför skärmen, och alla åtgärder loggas för revision.
Skriv text till urklippet programmatiskt eller läs dess aktuella innehåll, vilket möjliggör smidig dataöverföring mellan program utan att simulera tangentbordsgenvägar.
En agent aktiverar ett målapplicationsfönster, klickar i varje formulärfält i följd, skriver in lämpliga värden i mänsklig hastighet och skickar in – vilket replikerar en användare som fyller i ett komplext webb- eller skrivbordsformulär utan tillgång till något app-API.
Efter att ha utlöst en programåtgärd, fånga ett specifikt skärmområde och spara det som en tidsstämplad PNG, använd sedan bildigenkänning för att bekräfta att den förväntade knappen eller dialogrutan är synlig innan du fortsätter.
Håll ned Ctrl och klicka på flera filer i en filhanterare för att markera dem, dra sedan markeringen till en målmapp — allt skriptat som en enda reproducerbar automationssekvens.
Aktivera ett källprogram, markera och kopiera data med tangentbordsgenvägar, växla till ett målprogram via fönsteraktivering och klistra in — automatisera ett arbetsflöde som annars skulle kräva manuell kopiering och inklistring mellan program.
pyautogui, pillow, pygetwindow krävs. opencv-python är valfritt men behövs för bildigenkänning (find_on_screen).npx clawhub@latest install desktop-controlLogga in för att skriva en recension
Inga recensioner ännu. Var den första att dela din upplevelse!