PDF 문서에서 텍스트/표 추출, 생성, 병합, 분할, 워터마크 추가 및 양식 작성을 위한 종합 Pdf 툴킷입니다.
Pdf 스킬은 Python 라이브러리(pypdf, pdfplumber, reportlab)와 커맨드라인 도구(qpdf, pdftotext, pdftk)를 기반으로 AI 에이전트에게 PDF 조작 기능의 전체 모음을 제공합니다. 읽기 및 구조화된 데이터 추출부터 새 문서를 처음부터 생성하기, 파일 병합 또는 분할, 워터마크 추가, 비밀번호 암호화, PDF 양식 채우기까지 모든 것을 처리합니다. 프로그래밍 방식으로 PDF 문서를 대규모로 처리, 생성 또는 분석해야 할 때 이 스킬을 설치하세요.
npx clawhub@latest install pdf이 페이지 상단의 설치 버튼을 클릭하면 원클릭으로 설정할 수 있습니다
forms.md 참조에 설명된 대로 PDF 양식을 수동이 아닌 프로그래밍 방식으로 작성해야 합니다.pytesseract를 사용하여 이미지 기반 PDF에 OCR을 적용하고 기계가 읽을 수 있는 텍스트를 복원해야 합니다.reference.md에는 pdf-lib 같은 JS 대안도 다루고 있습니다).pdfplumber를 사용하여 레이아웃을 유지하면서 일반 텍스트를 추출하고, 모든 페이지에서 구조화된 표를 추출합니다. 표는 pandas DataFrame으로 직접 내보내거나 Excel 파일로 저장하여 후속 분석에 활용할 수 있습니다.
reportlab의 캔버스 API 또는 고수준 Platypus 문서 엔진을 사용하여 처음부터 새로운 Pdf 문서를 생성합니다. 여러 페이지로 구성된 보고서, 제목, 단락, 간격 및 페이지 나누기를 지원합니다.
여러 Pdf를 하나로 합치거나, 문서를 개별 페이지 또는 페이지 범위로 분할하고, 페이지를 임의의 각도로 회전할 수 있습니다 — Python의 pypdf 또는 명령줄의 qpdf/pdftk를 통해 모두 가능합니다.
스캔된 이미지 기반 Pdf를 pdf2image로 이미지로 변환하고, 각 페이지에 pytesseract OCR을 실행하여 내장된 텍스트 레이어가 없는 문서에서 기계 판독 가능한 텍스트를 복원합니다.
pypdf의 merge_page API를 사용하여 문서의 모든 페이지에 워터마크 페이지를 오버레이합니다. 별도의 사용자 비밀번호와 소유자 비밀번호로 Pdf를 암호화하거나, qpdf를 사용하여 비밀번호로 보호된 파일을 복호화합니다.
pypdf 또는 JavaScript pdf-lib 라이브러리를 통한 프로그래밍 방식의 양식 작성을 지원합니다 (스킬의 forms.md에 자세히 설명되어 있음). 표준 Pdf 양식을 채워야 하는 제출 워크플로우 자동화에 적합합니다.
에이전트가 API 또는 데이터베이스에서 데이터를 가져와 reportlab을 사용하여 형식을 지정하고, 사람이 워드 프로세서를 전혀 다루지 않아도 브랜드 스타일이 적용된 여러 페이지의 Pdf 보고서를 생성합니다.
에이전트가 수백 개의 Pdf 인보이스를 반복 처리하고, pdfplumber를 사용하여 항목별 테이블을 추출한 뒤, 회계 또는 컴플라이언스 검토를 위해 구조화된 결과를 스프레드시트나 데이터베이스에 저장합니다.
에이전트는 스캔된 Pdf(예: 종이 양식 또는 레거시 기록)를 수신하고, 각 페이지를 이미지로 변환한 후, pytesseract를 사용하여 OCR을 실행하고, 추출된 텍스트를 검색 또는 추가 처리를 위해 저장합니다.
에이전트가 Pdf 템플릿에서 양식 필드 정의를 읽어 CRM 또는 스프레드시트의 데이터로 채운 후, forms.md에 설명된 워크플로를 따라 서명 준비가 완료된 Pdf 양식을 출력합니다.
pypdf, pdfplumber, reportlab, pandas, pdf2image, pytesseract.pdftotext 및 pdfimages 명령줄 도구를 제공합니다.리뷰를 작성하려면 로그인
아직 리뷰가 없습니다. 첫 번째로 경험을 공유해 보세요!