Markdown Converter

Name: Markdown Converter
Author: Peter Steinberger

PDF, Office 문서, 이미지, 오디오, YouTube URL 등을 깔끔한 Markdown으로 변환하세요 — 설치가 필요 없습니다.

Peter Steinbergerv1.0.0

에이전트에 연결 중...

npx clawhub@latest install markdown-converter

72현재 설치 수

109누적 설치 수

v1.0.0버전

소스 보기(ClawHub)

Markdown Converter 스킬 개요

Markdown Converter는 markitdown을 사용하여 거의 모든 파일 형식을 깔끔하고 구조화된 Markdown으로 변환합니다 — 사전 설치 없이 uvx를 통해 실행됩니다. PDF 및 Office 문서부터 OCR을 활용한 이미지, 음성 변환이 포함된 오디오, ZIP 아카이브, 심지어 YouTube URL까지 모든 것을 처리합니다. 출력물은 문서 구조(제목, 표, 목록, 링크)를 보존하므로, LLM이나 텍스트 분석 파이프라인에 콘텐츠를 제공하는 데 이상적입니다.

사용 방법

Step 1: 터미널에서 실행하거나 AgentCellar에 설치

npx clawhub@latest install markdown-converter

또는

이 페이지 상단의 설치 버튼을 클릭하면 원클릭으로 설정할 수 있습니다

When to Use Markdown Converter

Best Fit

Office 문서(Word, Excel, PowerPoint) 또는 PDF를 LLM이나 RAG 파이프라인에 사용하기 위해 Markdown으로 변환해야 합니다.
이미지에서 텍스트와 메타데이터(EXIF + OCR)를 추출하거나 오디오 파일을 Markdown으로 변환(전사)하고 싶습니다.
ZIP 아카이브 내의 파일을 일괄 처리하여 모든 콘텐츠를 한 번에 Markdown으로 변환해야 합니다.
YouTube URL에서 자막 콘텐츠를 수동으로 복사·붙여넣기 하지 않고 구조화된 Markdown으로 가져오고 싶습니다.

When Not to Use

Markdown을 다른 형식(예: PDF 또는 DOCX)으로 다시 변환해야 하는 경우 — 이 스킬은 단방향입니다.
픽셀 단위의 완벽한 레이아웃 보존이 필요한 경우; 서식이 많은 문서를 Markdown으로 변환하면 본질적으로 손실이 발생합니다.

주요 기능

다양한 형식 지원

PDF, Word(.docx), PowerPoint(.pptx), Excel(.xlsx/.xls), HTML, CSV, JSON, XML, 이미지, 오디오, ZIP 압축 파일, YouTube URL, EPub 파일을 Markdown으로 변환합니다. — 모두 Markdown Converter로 처리 가능합니다.

설치 불필요

uvx markitdown을 사용하여 전역 설치 단계 없이 실행됩니다. 종속성은 첫 실행 시 가져와 캐시되며, 이후 실행은 상당히 빠릅니다.

구조 보존 출력

변환된 Markdown은 제목, 표, 글머리 기호 목록, 링크 등 문서 구조를 그대로 유지하여 이후 LLM 수집이나 텍스트 분석을 더욱 정확하게 수행할 수 있습니다.

이미지 OCR 및 오디오 전사

이미지에서 EXIF 메타데이터를 추출하고 OCR을 실행하며, 오디오 파일을 전사하여 그 결과를 Markdown 출력에 직접 삽입합니다.

Azure Document Intelligence 통합

기본 추출 품질이 낮은 복잡하거나 스캔된 PDF의 경우, -d 플래그를 사용하면 구성 가능한 엔드포인트를 통해 Azure Document Intelligence를 활성화하여 더 높은 품질의 결과를 얻을 수 있습니다.

유연한 입력/출력 모드

파일 경로, stdin 파이핑 및 stdout을 지원하며, 모호한 입력에 대해 파일 확장자, MIME 타입 및 문자셋을 지정할 수 있는 선택적 플래그를 제공합니다.

활용 사례

LLM 문서 수집 파이프라인

PDF 및 Word 문서 폴더를 검색 증강 생성(RAG) 시스템에 입력하기 전에 Markdown Converter를 사용해 Markdown으로 변환하여 구조를 보존함으로써, 모델이 제목과 표를 기반으로 추론할 수 있도록 합니다.

YouTube 트랜스크립트 추출

YouTube URL을 Markdown Converter에 직접 전달하여 구조화된 Markdown 트랜스크립트를 가져올 수 있으며, 터미널을 벗어나지 않고 요약이나 리서치 워크플로에 유용하게 활용할 수 있습니다.

Azure AI를 활용한 스캔된 PDF 텍스트 추출

표준 파싱으로 처리하기 어려운 스캔된 PDF 또는 이미지가 많은 PDF에서 텍스트를 추출하려면 Azure Document Intelligence 엔드포인트와 함께 -d 플래그를 사용하세요.

스프레드시트 및 데이터 파일 정규화

Excel, CSV 또는 JSON 파일을 Markdown 표로 변환하여 구조화된 데이터를 사람이 읽기 쉬운 형태로 만들고, 분석이나 보고서 포함을 위한 준비를 완료합니다.

요구 사항

Azure Document Intelligence Endpoint (선택 사항) — PDF 추출 향상을 위해 -d 플래그를 사용할 때만 필요합니다. -e 플래그를 통해 Azure Cognitive Services 엔드포인트를 제공하세요.

에이전트에 연결 중...

npx clawhub@latest install markdown-converter

72현재 설치 수

109누적 설치 수

v1.0.0버전

소스 보기(ClawHub)

자주 묻는 질문

리뷰

0개 리뷰

리뷰를 작성하려면 로그인

아직 리뷰가 없습니다. 첫 번째로 경험을 공유해 보세요!