Автоматизация рабочего стола с точностью до пикселя: управление мышью, клавиатурой, захват экрана, управление окнами и буфером обмена.
npx clawhub@latest install desktop-controlDesktop Control — это комплексный навык автоматизации рабочего стола, который предоставляет ИИ-агентам точное программное управление всей средой рабочего стола. Он охватывает перемещение мыши (включая плавные пути по кривым Безье), ввод с клавиатуры с настраиваемой скоростью, захват экрана и распознавание изображений, управление окнами и операции с буфером обмена. Созданный на основе PyAutoGUI и OpenCV, он включает механизмы безопасности, такие как защитные углы и режим подтверждения, чтобы автоматизация оставалась под вашим контролем.
npx clawhub@latest install desktop-controlНажмите кнопку Установить вверху страницы для настройки в один клик
Перемещайте курсор к абсолютным экранным координатам или на относительные смещения с возможностью построения плавных траекторий по кривым Безье, имитирующих естественные движения человека. Поддерживаются левая, правая и средняя кнопки мыши, одиночные, двойные и тройные щелчки, перетаскивание объектов, а также вертикальная и горизонтальная прокрутка.
Вводите текст с любой скоростью — от мгновенной до имитирующей человеческий ввод в WPM, выполняйте многоклавишные горячие клавиши (Ctrl+C, Win+R и т. д.), нажимайте специальные и функциональные клавиши, а также вручную удерживайте или отпускайте клавиши-модификаторы для сложных взаимодействий, например для выбора нескольких файлов.
Захватывайте полный экран или любую прямоугольную область и сохраняйте результат в формате PNG. При необходимости используйте OpenCV для поиска шаблонного изображения в любом месте экрана с настраиваемым порогом уверенности, что позволяет обнаруживать элементы без жёстко заданных координат.
Просматривайте список всех открытых окон, активируйте любое окно по частичному совпадению заголовка, получайте информацию о текущем активном окне, а также считывайте положение, размер и заголовок окна — всё это делает Desktop Control удобным инструментом для организации рабочих процессов с несколькими приложениями.
Режим защиты от сбоев прерывает автоматизацию, когда курсор мыши достигает любого угла экрана. Режим подтверждения запрашивает согласие пользователя перед каждым действием. Проверка границ предотвращает операции за пределами экрана, а все действия записываются в журнал для аудита.
Программно записывайте текст в буфер обмена или считывайте его текущее содержимое, обеспечивая бесперебойную передачу данных между приложениями без эмуляции сочетаний клавиш.
Агент активирует целевое окно приложения, последовательно щёлкает по каждому полю формы, вводит соответствующие значения с человекоподобной скоростью и отправляет данные — воспроизводя действия пользователя, заполняющего сложную веб- или десктопную форму без какого-либо доступа к API приложения.
После запуска действия в приложении захватите определённую область экрана и сохраните её в виде PNG-файла с временной меткой, затем используйте распознавание изображений, чтобы убедиться в наличии ожидаемой кнопки или диалогового окна перед продолжением работы.
Удерживайте Ctrl и щёлкайте по нескольким файлам в файловом менеджере, чтобы выделить их, затем перетащите выделение в папку назначения — всё это оформлено как единая воспроизводимая последовательность автоматизации с помощью Desktop Control.
Активируйте исходное приложение, выделите и скопируйте данные с помощью сочетаний клавиш, переключитесь в целевое приложение через активацию окна и вставьте данные — автоматизируя рабочий процесс, который иначе потребовал бы ручного копирования и вставки между программами.
pyautogui, pillow, pygetwindow. opencv-python необязателен, но нужен для распознавания изображений (find_on_screen).npx clawhub@latest install desktop-controlВойдите, чтобы написать отзыв
Отзывов пока нет. Будьте первым, кто поделится своим опытом!