Uitgebreide Pdf-toolkit voor het extraheren van tekst/tabellen, maken, samenvoegen, splitsen, watermerken en invullen van formulieren in Pdf-documenten.
npx clawhub@latest install pdfDe Pdf skill geeft je AI-agent een volledig pakket aan PDF-manipulatiemogelijkheden, aangedreven door Python-bibliotheken (pypdf, pdfplumber, reportlab) en opdrachtregelprogramma's (qpdf, pdftotext, pdftk). Het verwerkt alles van het lezen en extraheren van gestructureerde gegevens tot het maken van nieuwe documenten vanaf nul, het samenvoegen of splitsen van bestanden, het toevoegen van watermerken, het versleutelen met wachtwoorden en het invullen van PDF-formulieren. Installeer deze skill wanneer je PDF-documenten programmatisch op grote schaal wilt verwerken, genereren of analyseren.
npx clawhub@latest install pdfKlik op de Installeren-knop bovenaan deze pagina voor installatie met één klik
forms.md-referentie van de skill.pytesseract om machineleesbare tekst te herstellen.reference.md JS-alternatieven zoals pdf-lib behandelt).Gebruikt pdfplumber om platte tekst met behoud van lay-out en gestructureerde tabellen uit elke pagina te extraheren. Tabellen kunnen rechtstreeks worden geëxporteerd naar pandas DataFrames en worden opgeslagen als Excel-bestanden voor verdere analyse.
Genereer nieuwe Pdf-documenten vanaf nul met behulp van de canvas-API van reportlab of de hogere niveau Platypus-documentengine. Ondersteunt rapporten met meerdere pagina's, koppen, alinea's, spatiëring en pagina-einden.
Combineer meerdere Pdf-bestanden tot één, splits een document op in afzonderlijke pagina's of paginabereiken, en roteer pagina's met willekeurige graden — allemaal via pypdf in Python of qpdf/pdftk op de opdrachtregel.
Converteert gescande, op afbeeldingen gebaseerde Pdf's naar afbeeldingen met pdf2image en voert pytesseract OCR uit op elke pagina, waardoor machineleesbare tekst wordt hersteld uit documenten die geen ingebedde tekstlaag bevatten.
Overlay een watermerkpagina op elke pagina van een document met behulp van de merge_page-API van pypdf. Versleutel Pdf-bestanden met aparte gebruikers- en eigenaarswachtwoorden, of ontsleutel met een wachtwoord beveiligde bestanden met qpdf.
Ondersteunt programmatisch invullen van formulieren via pypdf of de JavaScript-bibliotheek pdf-lib (beschreven in de forms.md van de skill). Geschikt voor het automatiseren van indieningsworkflows waarbij standaard Pdf-formulieren ingevuld moeten worden.
Een agent haalt gegevens op uit een API of database, formatteert deze met reportlab en produceert een branded meerdere pagina's tellend Pdf-rapport — zonder dat een mens een tekstverwerker hoeft aan te raken.
Een agent itereert over honderden Pdf-facturen, gebruikt pdfplumber om regelitemtabellen te extraheren en schrijft de gestructureerde resultaten naar een spreadsheet of database voor boekhoudkundige of nalevingscontrole.
Een agent ontvangt gescande Pdf-bestanden (bijv. papieren formulieren of verouderde documenten), converteert elke pagina naar een afbeelding, voert OCR uit met pytesseract en slaat de geëxtraheerde tekst op voor zoekfunctionaliteit of verdere verwerking.
Een agent leest formuliervelddefinities uit een Pdf-sjabloon, vult deze in met gegevens uit een CRM of spreadsheet, en produceert ingevulde, ondertekeningsklare Pdf-formulieren — volgens de workflow beschreven in forms.md.
pypdf, pdfplumber, reportlab, pandas, pdf2image, pytesseract.pdftotext en pdfimages voor tekst- en afbeeldingsextractie.npx clawhub@latest install pdfInloggen om een beoordeling te schrijven
Nog geen beoordelingen. Wees de eerste om je ervaring te delen!