Automação de desktop pixel-perfect com controle de mouse, teclado, captura de tela, gerenciamento de janelas e área de transferência.
npx clawhub@latest install desktop-controlDesktop Control é uma skill abrangente de automação de desktop que oferece aos agentes de IA controle preciso e programático sobre todo o seu ambiente de área de trabalho. Ela cobre movimentos do mouse (incluindo trajetos suaves em curvas de Bézier), entrada de teclado em velocidades configuráveis, captura de tela e reconhecimento de imagens, gerenciamento de janelas e operações de área de transferência. Desenvolvido com PyAutoGUI e OpenCV, inclui mecanismos de segurança como cantos de segurança (failsafe) e modo de aprovação para manter a automação sob seu controle.
npx clawhub@latest install desktop-controlClique no botão Instalar no topo desta página para configuração com um clique
Mova o cursor para coordenadas absolutas na tela ou deslocamentos relativos, com caminhos opcionais em curva de Bézier suave que imitam o movimento humano natural. Suporta cliques com botão esquerdo, direito e do meio, cliques duplos/triplos, arrastar e soltar, e rolagem vertical e horizontal.
Digite texto em qualquer velocidade, desde instantânea até WPM semelhante ao humano, execute hotkeys com múltiplas teclas (Ctrl+C, Win+R, etc.), pressione teclas especiais e de função, e mantenha ou solte manualmente as teclas modificadoras para interações complexas como seleção de múltiplos arquivos.
Capture a tela inteira ou qualquer região retangular e salve o resultado como PNG. Opcionalmente, utilize o OpenCV para localizar uma imagem de template em qualquer parte da tela com um limiar de confiança configurável, permitindo a detecção de elementos sem coordenadas fixas no código.
Liste todas as janelas abertas, ative qualquer janela por correspondência parcial de título, recupere a janela atualmente em foco e leia a posição, o tamanho e o título da janela — tornando simples a orquestração de fluxos de trabalho com múltiplas aplicações.
Um modo à prova de falhas interrompe a automação quando o mouse atinge qualquer canto da tela. Um modo de aprovação solicita a confirmação do usuário antes de cada ação. A verificação de limites impede operações fora da tela, e todas as ações são registradas para auditoria.
Escreva texto na área de transferência de forma programática ou leia seu conteúdo atual, permitindo a transferência de dados entre aplicações de forma fluida sem simular atalhos de teclado.
Um agente ativa a janela de um aplicativo de destino, clica em cada campo do formulário em sequência, digita os valores apropriados em uma velocidade semelhante à humana e envia o formulário — replicando um usuário preenchendo um formulário complexo da web ou desktop sem qualquer acesso à API do aplicativo.
Após acionar uma ação em um aplicativo, capture uma região específica da tela para salvar como PNG com registro de data e hora e, em seguida, use o reconhecimento de imagem para confirmar que o botão ou diálogo esperado está visível antes de prosseguir.
Segure Ctrl e clique em vários arquivos em um gerenciador de arquivos para selecioná-los, depois arraste a seleção para uma pasta de destino — tudo automatizado como uma única sequência reproduzível com o Desktop Control.
Ative um aplicativo de origem, selecione e copie dados usando atalhos de teclado, alterne para um aplicativo de destino por meio da ativação de janela e cole — automatizando um fluxo de trabalho que, de outra forma, exigiria copiar e colar manualmente entre programas.
pyautogui, pillow, pygetwindow são obrigatórios. opencv-python é opcional, mas necessário para reconhecimento de imagem (find_on_screen).npx clawhub@latest install desktop-controlFaça login para escrever uma avaliação
Nenhuma avaliação ainda. Seja o primeiro a compartilhar sua experiência!