テキスト・テーブルの抽出、作成、結合、分割、透かし入れ、フォーム入力など、Pdf ドキュメントを多彩に操作できる総合ツールキット。
npx clawhub@latest install pdfPdf スキルは、Python ライブラリ(pypdf、pdfplumber、reportlab)およびコマンドラインツール(qpdf、pdftotext、pdftk)を活用した、PDF 操作機能の完全なスイートを AI エージェントに提供します。テキストや構造化データの読み取り・抽出から、新規ドキュメントのゼロからの作成、ファイルの結合や分割、透かしの追加、パスワードによる暗号化、PDF フォームへの入力まで、あらゆる処理に対応します。PDF ドキュメントをプログラムで大規模に処理・生成・分析する必要がある場合は、このスキルをインストールしてください。
npx clawhub@latest install pdfこのページ上部のインストールボタンをクリックするとワンクリックでセットアップできます
forms.md リファレンスに記載されているように、手動ではなくプログラムでPDFフォームに入力する必要がある場合。pytesseract を使用して画像ベースのPDFにOCRを適用し、機械可読テキストを復元する必要がある場合。reference.mdにはpdf-libなどのJS代替手段が記載されています)。レイアウトを保持したプレーンテキストの抽出と、任意のページからの構造化テーブルの抽出に pdfplumber を使用します。テーブルは pandas DataFrameに直接エクスポートし、下流の分析のためにExcelファイルとして保存することができます。
reportlabのキャンバスAPIまたは高水準のPlatypusドキュメントエンジンを使用して、新しいPdfドキュメントをゼロから生成します。複数ページのレポート、見出し、段落、スペーシング、改ページに対応しています。
複数のPDFを1つに結合したり、ドキュメントを個々のページやページ範囲に分割したり、任意の角度でページを回転させたりすることができます。これらの操作は、Pythonのpypdf、またはコマンドラインのqpdf/pdftkを使って実行できます。
pdf2image を使用してスキャンされた画像ベースのPdfを画像に変換し、各ページに対して pytesseract OCRを実行することで、埋め込みテキストレイヤーを持たないドキュメントから機械可読テキストを復元します。
pypdf の merge_page API を使用して、ドキュメントのすべてのページに透かしページを重ねて合成します。個別のユーザーパスワードとオーナーパスワードで Pdf を暗号化したり、qpdf を使用してパスワード保護されたファイルを復号化したりすることができます。
pypdf または JavaScript の pdf-lib ライブラリを使用したプログラムによるフォーム入力をサポートします(詳細はスキルの forms.md に記載)。標準的な Pdf フォームへの入力が必要な送信ワークフローの自動化に適しています。
エージェントがAPIまたはデータベースからデータを取得し、reportlabを使用してフォーマットを整え、ブランドロゴ入りの複数ページのPdfレポートを生成します — 人間がワードプロセッサに触れることは一切ありません。
エージェントが数百件のPdf請求書を順番に処理し、pdfplumberを使用して明細テーブルを抽出し、経理または法令遵守レビューのために構造化された結果をスプレッドシートやデータベースに書き出します。
エージェントはスキャンされたPdfファイル(例:紙の書類や過去の記録など)を受け取り、各ページを画像に変換し、pytesseractを使ってOCRを実行した後、抽出したテキストを検索やさらなる処理のために保存します。
エージェントはPdfテンプレートからフォームフィールドの定義を読み取り、CRMまたはスプレッドシートのデータを使って各フィールドに値を入力し、署名準備済みの完成したPdfフォームを出力します — forms.md に記載されたワークフローに従って処理が行われます。
pypdf、pdfplumber、reportlab、pandas、pdf2image、pytesseract。pdftotext と pdfimages を提供します。npx clawhub@latest install pdfレビューを書くにはログイン
まだレビューはありません。最初の体験をシェアしましょう!