ピクセル単位の精度で、マウス、キーボード、スクリーンキャプチャ、ウィンドウ管理、クリップボード制御を使ったデスクトップ自動化を実現します。
npx clawhub@latest install desktop-controlDesktop Control は、AIエージェントがデスクトップ環境全体を正確かつプログラム的に制御できる包括的なデスクトップ自動化スキルです。マウスの動き(スムーズなベジェ曲線パスを含む)、設定可能な速度でのキーボード入力、画面キャプチャと画像認識、ウィンドウ管理、クリップボード操作をカバーしています。PyAutoGUI と OpenCV をベースに構築されており、フェイルセーフコーナーや承認モードなどの安全機能を備え、自動化を常にあなたのコントロール下に置きます。
npx clawhub@latest install desktop-controlこのページ上部のインストールボタンをクリックするとワンクリックでセットアップできます
カーソルを絶対スクリーン座標または相対オフセットへ移動できます。自然な人間の動きを模倣した、オプションの滑らかなベジェ曲線パスにも対応しています。左・右・中ボタンのクリック、ダブル/トリプルクリック、ドラッグ&ドロップ、垂直および水平スクロールをサポートしています。
テキストを即時入力から人間らしいWPMまで任意の速度で入力し、マルチキーホットキー(Ctrl+C、Win+R など)を実行し、特殊キーやファンクションキーを押し、複数ファイルの選択などの複雑な操作のためにモディファイアキーを手動で押し続けたり離したりすることができます。
全画面または任意の矩形領域をキャプチャし、結果をPNGとして保存します。オプションでOpenCVを使用して、設定可能な信頼度しきい値でスクリーン上の任意の場所にあるテンプレート画像を検出できるため、座標をハードコーディングすることなく要素の検出が可能になります。
開いているすべてのウィンドウを一覧表示し、タイトルの部分一致で任意のウィンドウをアクティブ化し、現在フォーカスされているウィンドウを取得して、ウィンドウの位置・サイズ・タイトルを読み取ることができます。これにより、複数アプリケーションにまたがるワークフローを簡単に orchestrate できます。
マウスが画面のいずれかのコーナーに到達すると、フェイルセーフモードが自動化を中止します。承認モードは、各アクションの前にユーザーの確認を求めます。境界チェックにより画面外での操作が防止され、すべてのアクションは監査のためにログに記録されます。
キーボードショートカットをシミュレートすることなく、プログラムによってクリップボードにテキストを書き込んだり、現在の内容を読み取ったりすることで、アプリケーション間のシームレスなデータ転送を実現します。
エージェントがターゲットアプリケーションウィンドウをアクティブにし、各フォームフィールドに順番にクリックして入力し、人間に近いスピードで適切な値を入力して送信します。これにより、アプリのAPIアクセスなしに、複雑なウェブまたはデスクトップフォームへの入力を再現します。
アプリケーションのアクションをトリガーした後、特定の画面領域をキャプチャしてタイムスタンプ付きの PNG として保存し、次の処理に進む前に画像認識を使用して期待されるボタンまたはダイアログが表示されていることを確認します。
ファイルマネージャーで Ctrl を押しながら複数のファイルをクリックして選択し、その選択範囲を目的のフォルダーにドラッグします — すべてが単一の再現可能な自動化シーケンスとしてスクリプト化されています。
ソースアプリケーションを起動し、キーボードショートカットを使用してデータを選択・コピーし、ウィンドウのアクティベーションを通じて宛先アプリケーションに切り替えてペーストします。これにより、プログラム間で手動でコピー&ペーストする必要があったワークフローを自動化できます。
pyautogui、pillow、pygetwindow が必要です。opencv-python はオプションですが、画像認識(find_on_screen)に必要です。npx clawhub@latest install desktop-controlレビューを書くにはログイン
まだレビューはありません。最初の体験をシェアしましょう!