Toolkit Pdf completo per estrarre testo/tabelle, creare, unire, dividere, applicare filigrane e compilare moduli in documenti PDF.
npx clawhub@latest install pdfLa skill Pdf fornisce al tuo agente AI una suite completa di funzionalità per la manipolazione di PDF, basata su librerie Python (pypdf, pdfplumber, reportlab) e strumenti da riga di comando (qpdf, pdftotext, pdftk). Gestisce tutto, dalla lettura e l'estrazione di dati strutturati alla creazione di nuovi documenti da zero, all'unione o alla divisione di file, all'aggiunta di filigrane, alla cifratura con password e alla compilazione di moduli PDF. Installa questa skill quando hai bisogno di elaborare, generare o analizzare documenti PDF in modo programmatico e su larga scala.
npx clawhub@latest install pdfFai clic sul pulsante Installa in cima a questa pagina per la configurazione con un clic
forms.md della skill.pytesseract per recuperare testo leggibile dalla macchina.reference.md tratta alternative JS come pdf-lib).Utilizza pdfplumber per estrarre testo semplice con preservazione del layout e tabelle strutturate da qualsiasi pagina. Le tabelle possono essere esportate direttamente in pandas DataFrame e salvate come file Excel per analisi successive.
Genera nuovi documenti Pdf da zero utilizzando l'API canvas di reportlab o il motore documentale Platypus di livello superiore. Supporta report multipagina, intestazioni, paragrafi, spaziatura e interruzioni di pagina.
Combina più Pdf in uno solo, dividi un documento in singole pagine o intervalli di pagine e ruota le pagine di gradi arbitrari — tutto tramite pypdf in Python o qpdf/pdftk da riga di comando.
Converte i Pdf scansionati e basati su immagini in immagini tramite pdf2image ed esegue l'OCR con pytesseract su ogni pagina, recuperando testo leggibile automaticamente da documenti che non contengono alcun livello di testo incorporato.
Sovrapponi una pagina filigrana su ogni pagina di un documento utilizzando l'API merge_page di pypdf. Cifra i Pdf con password utente e proprietario separate, oppure decifra i file protetti da password con qpdf.
Supporta la compilazione programmatica dei moduli tramite pypdf o la libreria JavaScript pdf-lib (descritta nel file forms.md della skill). Adatto per automatizzare i flussi di lavoro di invio che richiedono la compilazione di moduli Pdf standard.
Un agente estrae dati da un'API o da un database, li formatta utilizzando reportlab e produce un report Pdf multi-pagina con branding aziendale — senza che nessun essere umano tocchi un elaboratore di testi.
Un agente itera su centinaia di fatture Pdf, utilizza pdfplumber per estrarre le tabelle delle voci e scrive i risultati strutturati in un foglio di calcolo o in un database per la revisione contabile o di conformità.
Un agente riceve Pdf scansionati (ad esempio, moduli cartacei o archivi storici), converte ogni pagina in un'immagine, esegue l'OCR con pytesseract e memorizza il testo estratto per la ricerca o ulteriori elaborazioni.
Un agente legge le definizioni dei campi del modulo da un template Pdf, le popola con i dati provenienti da un CRM o da un foglio di calcolo e produce moduli Pdf completi, pronti per la firma — seguendo il flusso di lavoro descritto in forms.md.
pypdf, pdfplumber, reportlab, pandas, pdf2image, pytesseract.pdftotext e pdfimages per l'estrazione di testo e immagini.npx clawhub@latest install pdfAccedi per scrivere una recensione
Nessuna recensione ancora. Sii il primo a condividere la tua esperienza!