Umfassendes Pdf-Toolkit zum Extrahieren von Text/Tabellen, Erstellen, Zusammenführen, Aufteilen, mit Wasserzeichen versehen und Ausfüllen von Formularfeldern in Pdf-Dokumenten.
npx clawhub@latest install pdfDie Pdf-Skill gibt Ihrem KI-Agenten ein vollständiges Set an PDF-Manipulationsfähigkeiten, unterstützt durch Python-Bibliotheken (pypdf, pdfplumber, reportlab) und Kommandozeilenwerkzeuge (qpdf, pdftotext, pdftk). Er übernimmt alles vom Lesen und Extrahieren strukturierter Daten bis hin zum Erstellen neuer Dokumente von Grund auf, dem Zusammenführen oder Aufteilen von Dateien, dem Hinzufügen von Wasserzeichen, der Verschlüsselung mit Passwörtern und dem Ausfüllen von PDF-Formularen. Installieren Sie diesen Skill, wenn Sie PDF-Dokumente programmgesteuert und in großem Umfang verarbeiten, generieren oder analysieren müssen.
npx clawhub@latest install pdfKlicke oben auf der Seite auf Installieren für die Ein-Klick-Einrichtung
forms.md-Referenz der Skill beschrieben.pytesseract, um maschinenlesbaren Text wiederherzustellen.reference.md JS-Alternativen wie pdf-lib abdeckt).Verwendet pdfplumber, um einfachen Text mit Layouterhaltung und strukturierte Tabellen aus beliebigen Seiten zu extrahieren. Tabellen können direkt in pandas DataFrames exportiert und als Excel-Dateien für weiterführende Analysen gespeichert werden.
Erstelle neue Pdf-Dokumente von Grund auf mit der Canvas-API von reportlab oder der übergeordneten Platypus-Document-Engine. Unterstützt mehrseitige Berichte, Überschriften, Absätze, Abstände und Seitenumbrüche.
Mehrere Pdfs zu einem einzigen Dokument zusammenführen, ein Dokument in einzelne Seiten oder Seitenbereiche aufteilen und Seiten um beliebige Grad drehen — alles über pypdf in Python oder qpdf/pdftk auf der Kommandozeile.
Konvertiert gescannte, bildbasierte Pdfs mithilfe von pdf2image in Bilder und führt pytesseract OCR auf jeder Seite aus, um maschinenlesbaren Text aus Dokumenten wiederherzustellen, die keine eingebettete Textebene enthalten.
Lege eine Wasserzeichenseite über jede Seite eines Dokuments mithilfe der merge_page-API von pypdf. Verschlüssele Pdf-Dateien mit separaten Benutzer- und Eigentümerpasswörtern oder entschlüssele passwortgeschützte Dateien mit qpdf.
Unterstützt das programmatische Ausfüllen von Formularen über pypdf oder die JavaScript-Bibliothek pdf-lib (detailliert beschrieben in der forms.md des Skills). Geeignet für die Automatisierung von Einreichungs-Workflows, bei denen standardmäßige Pdf-Formulare ausgefüllt werden müssen.
Ein Agent ruft Daten aus einer API oder Datenbank ab, formatiert sie mit reportlab und erstellt einen gebrandeten mehrseitigen Pdf-Bericht – ohne dass ein Mensch ein Textverarbeitungsprogramm anfassen muss.
Ein Agent iteriert über Hunderte von Pdf-Rechnungen, verwendet pdfplumber, um Positionstabellen zu extrahieren, und schreibt die strukturierten Ergebnisse in eine Tabellenkalkulation oder Datenbank zur Buchhaltungs- oder Compliance-Prüfung.
Ein Agent empfängt gescannte Pdf-Dateien (z. B. Papierformulare oder Altakten), konvertiert jede Seite in ein Bild, führt OCR mit pytesseract durch und speichert den extrahierten Text für die Suche oder Weiterverarbeitung.
Ein Agent liest Formularfelddefinitionen aus einer Pdf-Vorlage, befüllt sie mit Daten aus einem CRM oder einer Tabellenkalkulation und gibt ausgefüllte, unterschriftsreife Pdf-Formulare aus – gemäß dem in forms.md beschriebenen Workflow.
pypdf, pdfplumber, reportlab, pandas, pdf2image, pytesseract.pdftotext und pdfimages für die Text- und Bildextraktion bereit.npx clawhub@latest install pdfAnmelden, um eine Bewertung zu schreiben
Noch keine Bewertungen. Sei der Erste, der seine Erfahrungen teilt!