PDF, Office 문서, 이미지, 오디오, YouTube URL 등을 깔끔한 Markdown으로 변환하세요 — 설치가 필요 없습니다.
Markdown Converter는 markitdown을 사용하여 거의 모든 파일 형식을 깔끔하고 구조화된 Markdown으로 변환합니다 — 사전 설치 없이 uvx를 통해 실행됩니다. PDF 및 Office 문서부터 OCR을 활용한 이미지, 음성 변환이 포함된 오디오, ZIP 아카이브, 심지어 YouTube URL까지 모든 것을 처리합니다. 출력물은 문서 구조(제목, 표, 목록, 링크)를 보존하므로, LLM이나 텍스트 분석 파이프라인에 콘텐츠를 제공하는 데 이상적입니다.
npx clawhub@latest install markdown-converter이 페이지 상단의 설치 버튼을 클릭하면 원클릭으로 설정할 수 있습니다
PDF, Word(.docx), PowerPoint(.pptx), Excel(.xlsx/.xls), HTML, CSV, JSON, XML, 이미지, 오디오, ZIP 압축 파일, YouTube URL, EPub 파일을 Markdown으로 변환합니다. — 모두 Markdown Converter로 처리 가능합니다.
uvx markitdown을 사용하여 전역 설치 단계 없이 실행됩니다. 종속성은 첫 실행 시 가져와 캐시되며, 이후 실행은 상당히 빠릅니다.
변환된 Markdown은 제목, 표, 글머리 기호 목록, 링크 등 문서 구조를 그대로 유지하여 이후 LLM 수집이나 텍스트 분석을 더욱 정확하게 수행할 수 있습니다.
이미지에서 EXIF 메타데이터를 추출하고 OCR을 실행하며, 오디오 파일을 전사하여 그 결과를 Markdown 출력에 직접 삽입합니다.
기본 추출 품질이 낮은 복잡하거나 스캔된 PDF의 경우, -d 플래그를 사용하면 구성 가능한 엔드포인트를 통해 Azure Document Intelligence를 활성화하여 더 높은 품질의 결과를 얻을 수 있습니다.
파일 경로, stdin 파이핑 및 stdout을 지원하며, 모호한 입력에 대해 파일 확장자, MIME 타입 및 문자셋을 지정할 수 있는 선택적 플래그를 제공합니다.
PDF 및 Word 문서 폴더를 검색 증강 생성(RAG) 시스템에 입력하기 전에 Markdown Converter를 사용해 Markdown으로 변환하여 구조를 보존함으로써, 모델이 제목과 표를 기반으로 추론할 수 있도록 합니다.
YouTube URL을 Markdown Converter에 직접 전달하여 구조화된 Markdown 트랜스크립트를 가져올 수 있으며, 터미널을 벗어나지 않고 요약이나 리서치 워크플로에 유용하게 활용할 수 있습니다.
표준 파싱으로 처리하기 어려운 스캔된 PDF 또는 이미지가 많은 PDF에서 텍스트를 추출하려면 Azure Document Intelligence 엔드포인트와 함께 -d 플래그를 사용하세요.
Excel, CSV 또는 JSON 파일을 Markdown 표로 변환하여 구조화된 데이터를 사람이 읽기 쉬운 형태로 만들고, 분석이나 보고서 포함을 위한 준비를 완료합니다.
-d 플래그를 사용할 때만 필요합니다. -e 플래그를 통해 Azure Cognitive Services 엔드포인트를 제공하세요.리뷰를 작성하려면 로그인
아직 리뷰가 없습니다. 첫 번째로 경험을 공유해 보세요!