Pixelgenaue Desktop-Automatisierung mit Maus-, Tastatur-, Bildschirmaufnahme-, Fensterverwaltungs- und Zwischenablagesteuerung.
npx clawhub@latest install desktop-controlDesktop Control ist eine umfassende Desktop-Automatisierungsfähigkeit, die KI-Agenten präzise, programmatische Kontrolle über Ihre gesamte Desktop-Umgebung gibt. Sie umfasst Mausbewegungen (einschließlich sanfter Bezier-Kurven-Pfade), Tastatureingaben mit konfigurierbarer Geschwindigkeit, Bildschirmaufnahme und Bilderkennung, Fensterverwaltung sowie Zwischenablage-Operationen. Aufgebaut auf PyAutoGUI und OpenCV enthält sie Sicherheitsmechanismen wie Failsafe-Ecken und einen Genehmigungsmodus, um die Automatisierung unter Ihrer Kontrolle zu halten.
npx clawhub@latest install desktop-controlKlicke oben auf der Seite auf Installieren für die Ein-Klick-Einrichtung
Bewege den Cursor zu absoluten Bildschirmkoordinaten oder relativen Versätzen, mit optionalen sanften Bézierkurven-Pfaden, die natürliche menschliche Bewegungen nachahmen. Unterstützt Links-, Rechts- und Mittelklicks, Doppel-/Dreifachklicks, Drag-and-Drop sowie vertikales und horizontales Scrollen.
Gib Text mit beliebiger Geschwindigkeit ein – von sofort bis hin zu menschenähnlichen WPM –, führe Mehr-Tasten-Hotkeys aus (Strg+C, Win+R usw.), drücke Sonder- und Funktionstasten und halte Modifikatortasten für komplexe Interaktionen wie die Auswahl mehrerer Dateien manuell gedrückt oder lasse sie los.
Nimmt den gesamten Bildschirm oder einen beliebigen rechteckigen Bereich auf und speichert das Ergebnis als PNG. Optional kann OpenCV verwendet werden, um ein Vorlagenbild an beliebiger Stelle auf dem Bildschirm mit einem konfigurierbaren Konfidenzschwellenwert zu lokalisieren – dies ermöglicht die Elementerkennung ohne fest kodierte Koordinaten.
Alle geöffneten Fenster auflisten, beliebige Fenster per teilweiser Titelübereinstimmung aktivieren, das aktuell fokussierte Fenster abrufen sowie Position, Größe und Titel von Fenstern auslesen – so lassen sich Multi-Anwendungs-Workflows mühelos orchestrieren.
Ein Ausfallsicherheitsmodus bricht die Automatisierung ab, wenn die Maus eine beliebige Bildschirmecke erreicht. Ein Genehmigungsmodus fordert vor jeder Aktion eine Benutzerbestätigung an. Eine Bereichsprüfung verhindert Operationen außerhalb des Bildschirms, und alle Aktionen werden zur Überprüfung protokolliert.
Text programmgesteuert in die Zwischenablage schreiben oder deren aktuellen Inhalt lesen, um eine nahtlose Datenübertragung zwischen Anwendungen zu ermöglichen – ohne Tastatürkürzel simulieren zu müssen.
Ein Agent aktiviert ein Zielanwendungsfenster, klickt der Reihe nach in jedes Formularfeld, gibt die entsprechenden Werte mit menschenähnlicher Geschwindigkeit ein und sendet das Formular ab – dabei repliziert er einen Benutzer, der ein komplexes Web- oder Desktop-Formular ausfüllt, ohne auf eine App-API zugreifen zu müssen.
Nachdem eine Anwendungsaktion ausgelöst wurde, wird ein bestimmter Bildschirmbereich erfasst und als PNG mit Zeitstempel gespeichert. Anschließend wird mithilfe von Bilderkennung überprüft, ob die erwartete Schaltfläche oder der erwartete Dialog sichtbar ist, bevor der Vorgang fortgesetzt wird.
Halte Ctrl gedrückt und klicke im Dateimanager auf mehrere Dateien, um sie auszuwählen, und ziehe die Auswahl dann in einen Zielordner – alles als eine einzige, reproduzierbare Automatisierungssequenz mit Desktop Control geskriptet.
Aktiviere eine Quellanwendung, wähle Daten aus und kopiere sie mit Tastaturkürzeln, wechsle über die Fensteraktivierung zu einer Zielanwendung und füge sie ein – so automatisierst du einen Arbeitsablauf, der sonst manuelles Kopieren und Einfügen zwischen Programmen erfordert.
pyautogui, pillow, pygetwindow sind erforderlich. opencv-python ist optional, wird jedoch für die Bilderkennung (find_on_screen) benötigt.npx clawhub@latest install desktop-controlAnmelden, um eine Bewertung zu schreiben
Noch keine Bewertungen. Sei der Erste, der seine Erfahrungen teilt!