Pdf

Name: Pdf
Author: awspace

テキスト・テーブルの抽出、作成、結合、分割、透かし入れ、フォーム入力など、Pdf ドキュメントを多彩に操作できる総合ツールキット。

awspacev1.0.0

エージェントに接続中...

npx clawhub@latest install pdf

55スター数

36.8kダウンロード数

195現在のインストール数

755累計インストール数

v1.0.0バージョン

ソースコードを見る(ClawHub)

Pdf スキル概要

Pdf スキルは、Python ライブラリ（pypdf、pdfplumber、reportlab）およびコマンドラインツール（qpdf、pdftotext、pdftk）を活用した、PDF 操作機能の完全なスイートを AI エージェントに提供します。テキストや構造化データの読み取り・抽出から、新規ドキュメントのゼロからの作成、ファイルの結合や分割、透かしの追加、パスワードによる暗号化、PDF フォームへの入力まで、あらゆる処理に対応します。PDF ドキュメントをプログラムで大規模に処理・生成・分析する必要がある場合は、このスキルをインストールしてください。

使い方

Step 1: ターミナルで実行するか AgentCellar にインストール

npx clawhub@latest install pdf

または

このページ上部のインストールボタンをクリックするとワンクリックでセットアップできます

When to Use Pdf

Best Fit

大規模なデータ抽出 — 多数のPDFからテキストや表形式のデータを取り出し、パイプライン、スプレッドシート、またはデータベースに送り込む必要がある場合。
ドキュメントの生成 — 動的なデータを使用して、フォーマットされた複数ページのPDFレポートをプログラムで作成する必要がある場合。
ドキュメント管理ワークフロー — 複数のPDFを1つに結合したり、大きなドキュメントを個別のページや範囲に分割したり、ページの回転・並べ替えを行う必要がある場合。
フォームの自動化 — スキルの forms.md リファレンスに記載されているように、手動ではなくプログラムでPDFフォームに入力する必要がある場合。
スキャンドキュメントの処理 — pytesseract を使用して画像ベースのPDFにOCRを適用し、機械可読テキストを復元する必要がある場合。

When Not to Use

シンプルな一時的な閲覧 — PDFを視覚的に読むだけでよい場合は、このスキルよりも標準的なPDFビューアの方が適しています。
複雑なレイアウトを維持した編集 — リッチなWYSIWYG編集（赤字修正、リッチフォーマットの注釈など）が必要な場合は、専用のデスクトップPDFエディタの方が適しています。
Python以外の環境 — スタックが完全にJavaScript/Node.jsである場合、スキルのPythonライブラリは直接適用されません（ただし、reference.mdにはpdf-libなどのJS代替手段が記載されています）。

主な機能

テキストとテーブルの抽出

レイアウトを保持したプレーンテキストの抽出と、任意のページからの構造化テーブルの抽出に pdfplumber を使用します。テーブルは pandas DataFrameに直接エクスポートし、下流の分析のためにExcelファイルとして保存することができます。

PDFの作成（reportlab使用）

reportlabのキャンバスAPIまたは高水準のPlatypusドキュメントエンジンを使用して、新しいPdfドキュメントをゼロから生成します。複数ページのレポート、見出し、段落、スペーシング、改ページに対応しています。

PDFの結合・分割・回転

複数のPDFを1つに結合したり、ドキュメントを個々のページやページ範囲に分割したり、任意の角度でページを回転させたりすることができます。これらの操作は、Pythonのpypdf、またはコマンドラインのqpdf/pdftkを使って実行できます。

スキャンされたPDFのOCR

pdf2image を使用してスキャンされた画像ベースのPdfを画像に変換し、各ページに対して pytesseract OCRを実行することで、埋め込みテキストレイヤーを持たないドキュメントから機械可読テキストを復元します。

透かしとパスワード保護

pypdf の merge_page API を使用して、ドキュメントのすべてのページに透かしページを重ねて合成します。個別のユーザーパスワードとオーナーパスワードで Pdf を暗号化したり、qpdf を使用してパスワード保護されたファイルを復号化したりすることができます。

Pdf フォーム処理

pypdf または JavaScript の pdf-lib ライブラリを使用したプログラムによるフォーム入力をサポートします（詳細はスキルの forms.md に記載）。標準的な Pdf フォームへの入力が必要な送信ワークフローの自動化に適しています。

ユースケース

自動レポート生成

エージェントがAPIまたはデータベースからデータを取得し、reportlabを使用してフォーマットを整え、ブランドロゴ入りの複数ページのPdfレポートを生成します — 人間がワードプロセッサに触れることは一切ありません。

請求書や契約書データの一括抽出

エージェントが数百件のPdf請求書を順番に処理し、pdfplumberを使用して明細テーブルを抽出し、経理または法令遵守レビューのために構造化された結果をスプレッドシートやデータベースに書き出します。

スキャンされた文書のデジタル化

エージェントはスキャンされたPdfファイル（例：紙の書類や過去の記録など）を受け取り、各ページを画像に変換し、pytesseractを使ってOCRを実行した後、抽出したテキストを検索やさらなる処理のために保存します。

PDFフォーム自動入力パイプライン

エージェントはPdfテンプレートからフォームフィールドの定義を読み取り、CRMまたはスプレッドシートのデータを使って各フィールドに値を入力し、署名準備済みの完成したPdfフォームを出力します — forms.md に記載されたワークフローに従って処理が行われます。

動作要件

Pythonランタイム — 必須。使用ライブラリ: pypdf、pdfplumber、reportlab、pandas、pdf2image、pytesseract。
Tesseract OCRバイナリ (オプション) — スキャンされたPdfのOCRにのみ必要。ホストシステムに別途インストールする必要があります。
poppler-utils (オプション) — テキストおよび画像抽出用のコマンドラインツール pdftotext と pdfimages を提供します。
qpdf (オプション) — PdfのマージS、分割、回転、および復号化を行うコマンドラインツール。
pdftk (オプション) — ホストで利用可能な場合、Pdfのマージ、分割、および回転を行う代替コマンドラインツール。

エージェントに接続中...

npx clawhub@latest install pdf

55スター数

36.8kダウンロード数

195現在のインストール数

755累計インストール数

v1.0.0バージョン

ソースコードを見る(ClawHub)

よくある質問

レビュー

0件のレビュー

レビューを書くにはログイン

まだレビューはありません。最初の体験をシェアしましょう！