Automazione desktop perfetta al pixel con controllo di mouse, tastiera, acquisizione schermo, gestione finestre e appunti.
npx clawhub@latest install desktop-controlDesktop Control è una skill completa per l'automazione del desktop che offre agli agenti AI un controllo preciso e programmatico sull'intero ambiente desktop. Comprende movimenti del mouse (inclusi percorsi fluidi con curve di Bézier), input da tastiera a velocità configurabile, acquisizione dello schermo e riconoscimento delle immagini, gestione delle finestre e operazioni con gli appunti. Basato su PyAutoGUI e OpenCV, include meccanismi di sicurezza come gli angoli failsafe e la modalità di approvazione per mantenere l'automazione sotto il tuo controllo.
npx clawhub@latest install desktop-controlFai clic sul pulsante Installa in cima a questa pagina per la configurazione con un clic
Sposta il cursore verso coordinate assolute dello schermo o offset relativi, con percorsi opzionali a curva di Bézier che imitano il movimento umano naturale. Supporta clic sinistro, destro e centrale, doppio/triplo clic, trascinamento della selezione e scorrimento sia verticale che orizzontale.
Digita testo a qualsiasi velocità, dall'istantaneo a un ritmo simile a quello umano in WPM, esegui hotkey multi-tasto (Ctrl+C, Win+R, ecc.), premi tasti speciali e funzione, e tieni premuti o rilascia manualmente i tasti modificatori per interazioni complesse come la selezione di più file.
Acquisisci l'intero schermo o qualsiasi area rettangolare e salva il risultato come PNG. Utilizza opzionalmente OpenCV per individuare un'immagine modello in qualsiasi punto dello schermo con una soglia di confidenza configurabile, consentendo il rilevamento degli elementi senza coordinate hardcoded.
Elenca tutte le finestre aperte, attiva qualsiasi finestra tramite corrispondenza parziale del titolo, recupera la finestra attualmente in primo piano e leggi posizione, dimensioni e titolo della finestra — rendendo semplice orchestrare flussi di lavoro con più applicazioni.
Una modalità di sicurezza interrompe l'automazione quando il mouse raggiunge un angolo qualsiasi dello schermo. Una modalità di approvazione richiede la conferma dell'utente prima di ogni azione. Il controllo dei limiti impedisce operazioni al di fuori dello schermo e tutte le azioni vengono registrate a scopo di audit.
Scrivi testo negli appunti o leggi il loro contenuto corrente in modo programmatico, consentendo un trasferimento fluido di dati tra applicazioni senza simulare scorciatoie da tastiera.
Un agente attiva la finestra dell'applicazione di destinazione, fa clic su ogni campo del modulo in sequenza, digita i valori appropriati a una velocità simile a quella umana e invia il tutto — replicando un utente che compila un modulo web o desktop complesso senza alcun accesso all'API dell'applicazione.
Dopo aver attivato un'azione dell'applicazione, acquisisci una specifica area dello schermo per salvarla come file PNG con timestamp, quindi utilizza il riconoscimento delle immagini per confermare che il pulsante o la finestra di dialogo attesi siano visibili prima di procedere.
Tieni premuto Ctrl e fai clic su più file in un file manager per selezionarli, poi trascina la selezione in una cartella di destinazione — il tutto gestito come un'unica sequenza di automazione riproducibile.
Attiva un'applicazione sorgente, seleziona e copia i dati tramite scorciatoie da tastiera, passa a un'applicazione di destinazione tramite l'attivazione della finestra e incolla — automatizzando un flusso di lavoro che altrimenti richiederebbe un copia-incolla manuale tra i programmi.
pyautogui, pillow, pygetwindow sono obbligatori. opencv-python è opzionale ma necessario per il riconoscimento delle immagini (find_on_screen).npx clawhub@latest install desktop-controlAccedi per scrivere una recensione
Nessuna recensione ancora. Sii il primo a condividere la tua esperienza!