Pdf 技能為您的 AI 代理提供一整套 PDF 操作功能,由 Python 函式庫(pypdf、pdfplumber、reportlab)和命令列工具(qpdf、pdftotext、pdftk)提供支援。它能處理從讀取和擷取結構化資料、從頭建立新文件、合併或分割檔案、新增浮水印、密碼加密,到填寫 PDF 表單等各種需求。當您需要以程式化方式大規模處理、產生或分析 PDF 文件時,請安裝此技能。
npx clawhub@latest install pdf點擊本頁頂部的 安裝 按鈕即可一鍵設定
forms.md 參考文件所述。pytesseract 對圖像型 PDF 進行 OCR,以還原可供機器讀取的文字。reference.md 涵蓋了 JS 替代方案,例如 pdf-lib)。使用 pdfplumber 從任意頁面擷取保留版面配置的純文字及結構化表格。表格可直接匯出至 pandas DataFrame,並儲存為 Excel 檔案,以供後續分析使用。
使用 reportlab 的 canvas API 或更高層級的 Platypus 文件引擎,從頭開始產生全新的 Pdf 文件。支援多頁報表、標題、段落、間距及分頁符號。
將多個 Pdf 合併為一個、將文件拆分為單頁或指定頁面範圍,以及將頁面旋轉任意角度——可透過 Python 中的 pypdf,或在命令列使用 qpdf/pdftk 來完成。
使用 pdf2image 將掃描的影像型 Pdf 轉換為圖片,並對每一頁執行 pytesseract OCR,從不含內嵌文字層的文件中還原可供機器讀取的文字內容。
使用 pypdf 的 merge_page API,將浮水印頁面疊加至文件的每一頁。以獨立的使用者密碼與擁有者密碼加密 Pdf 檔案,或使用 qpdf 解密受密碼保護的檔案。
支援透過 pypdf 或 JavaScript pdf-lib 函式庫以程式化方式填寫表單(詳見該技能的 forms.md)。適用於需要填入標準 Pdf 表單的自動化提交工作流程。
代理程式從 API 或資料庫中提取資料,使用 reportlab 進行格式化,並生成具有品牌風格的多頁 Pdf 報告——全程無需任何人工操作文書處理軟體。
一個代理程式逐一處理數百份 Pdf 發票,使用 pdfplumber 擷取明細項目表格,並將結構化結果寫入試算表或資料庫,以供會計或合規審查使用。
代理程式接收掃描的 Pdf 檔案(例如紙本表單或舊式記錄),將每一頁轉換為圖片,使用 pytesseract 執行 OCR 光學字元辨識,並儲存擷取的文字以供搜尋或進一步處理。
一個代理程式從 Pdf 範本中讀取表單欄位定義,以 CRM 或試算表中的資料填入相應欄位,並輸出已完成、可供簽署的 Pdf 表單——依照 forms.md 中描述的工作流程執行。
pypdf、pdfplumber、reportlab、pandas、pdf2image、pytesseract。pdftotext 與 pdfimages 命令列工具,用於文字與影像擷取。登入後撰寫評價
尚無評價。來分享你的使用體驗吧!