Omfattande Pdf-verktygsuppsättning för att extrahera text/tabeller, skapa, sammanfoga, dela, vattenstämpla och fylla i formulär i PDF-dokument.
npx clawhub@latest install pdfPdf-färdigheten ger din AI-agent en komplett uppsättning PDF-hanteringsfunktioner drivna av Python-bibliotek (pypdf, pdfplumber, reportlab) och kommandoradsverktyg (qpdf, pdftotext, pdftk). Den hanterar allt från att läsa och extrahera strukturerad data till att skapa nya dokument från grunden, sammanfoga eller dela filer, lägga till vattenstämplar, kryptera med lösenord och fylla i PDF-formulär. Installera den här färdigheten när du behöver programmatiskt bearbeta, generera eller analysera PDF-dokument i stor skala.
npx clawhub@latest install pdfKlicka på Installera-knappen längst upp på sidan för installation med ett klick
forms.md-referens.pytesseract för att återskapa maskinläsbar text.reference.md tar upp JS-alternativ som pdf-lib).Använder pdfplumber för att extrahera ren text med bevarad layout och strukturerade tabeller från valfri sida. Tabeller kan exporteras direkt till pandas DataFrames och sparas som Excel-filer för vidare analys.
Generera nya Pdf-dokument från grunden med hjälp av reportlabs canvas-API eller den mer avancerade Platypus-dokumentmotorn. Stöder rapporter med flera sidor, rubriker, stycken, avstånd och sidbrytningar.
Kombinera flera Pdf-filer till en, dela upp ett dokument i enskilda sidor eller sidintervall och rotera sidor med valfria grader — allt via pypdf i Python eller qpdf/pdftk på kommandoraden.
Konverterar skannade, bildbaserade Pdf-filer till bilder med pdf2image och kör pytesseract OCR på varje sida, vilket återställer maskinläsbar text från dokument som inte innehåller något inbäddat textlager.
Lägg ett vattenmärke över varje sida i ett dokument med hjälp av pypdf:s merge_page-API. Kryptera Pdf-filer med separata användar- och ägarlösenord, eller dekryptera lösenordsskyddade filer med qpdf.
Stöder programmatisk ifyllning av formulär via pypdf eller JavaScript-biblioteket pdf-lib (detaljerat i skicklighetens forms.md). Lämplig för att automatisera inskickningsarbetsflöden som kräver ifyllning av standard-Pdf-formulär.
En agent hämtar data från ett API eller en databas, formaterar den med hjälp av reportlab och skapar en varumärkesanpassad Pdf-rapport med flera sidor — utan att någon människa behöver öppna ett ordbehandlingsprogram.
En agent itererar över hundratals Pdf-fakturor, använder pdfplumber för att extrahera tabeller med radposter och skriver de strukturerade resultaten till ett kalkylblad eller en databas för redovisnings- eller efterlevnadsgranskning.
En agent tar emot skannade Pdf-filer (t.ex. pappersformulär eller äldre arkivhandlingar), konverterar varje sida till en bild, kör OCR med pytesseract och lagrar den extraherade texten för sökning eller vidare bearbetning.
En agent läser formulärfältsdefinitioner från en Pdf-mall, fyller i dem med data från ett CRM-system eller kalkylblad och genererar ifyllda, signaturklara Pdf-formulär — enligt arbetsflödet som beskrivs i forms.md.
pypdf, pdfplumber, reportlab, pandas, pdf2image, pytesseract.pdftotext och pdfimages för text- och bildextrahering.npx clawhub@latest install pdfLogga in för att skriva en recension
Inga recensioner ännu. Var den första att dela din upplevelse!