Convierte PDFs, documentos de Office, imágenes, audio, URLs de YouTube y más a Markdown limpio — sin necesidad de instalación.
npx clawhub@latest install markdown-converterMarkdown Converter transforma prácticamente cualquier formato de archivo en Markdown limpio y estructurado utilizando markitdown — invocado a través de uvx sin necesidad de instalación previa. Maneja todo, desde PDFs y documentos de Office hasta imágenes con OCR, audio con transcripción, archivos ZIP e incluso URLs de YouTube. La salida preserva la estructura del documento (encabezados, tablas, listas, enlaces), lo que lo hace ideal para alimentar contenido en LLMs o canalizaciones de análisis de texto.
npx clawhub@latest install markdown-converterHaz clic en el botón Instalar en la parte superior de esta página para una configuración rápida
Convierte PDF, Word (.docx), PowerPoint (.pptx), Excel (.xlsx/.xls), HTML, CSV, JSON, XML, imágenes, audio, archivos ZIP, URLs de YouTube y archivos EPub — todo a Markdown.
Utiliza uvx markitdown para ejecutarse sin un paso de instalación global. Las dependencias se obtienen y almacenan en caché en la primera ejecución; las ejecuciones posteriores son significativamente más rápidas.
El Markdown convertido conserva la estructura del documento, incluyendo encabezados, tablas, listas con viñetas y enlaces — lo que hace que la ingestión posterior por LLM o el análisis de texto sea más preciso.
Extrae metadatos EXIF y ejecuta OCR en imágenes, y transcribe archivos de audio, incorporando los resultados directamente en la salida de Markdown Converter.
Para PDFs complejos o escaneados con una extracción predeterminada deficiente, el indicador -d habilita Azure Document Intelligence a través de un endpoint configurable para obtener resultados de mayor calidad.
Admite rutas de archivos, canalización por stdin y stdout — con indicadores opcionales para especificar la extensión de archivo, el tipo MIME y el conjunto de caracteres en entradas ambiguas.
Convierte una carpeta de PDFs y documentos Word a Markdown antes de introducirlos en un sistema de generación aumentada por recuperación (RAG), preservando la estructura para que el modelo pueda razonar sobre encabezados y tablas.
Pasa una URL de YouTube directamente al Markdown Converter para obtener una transcripción estructurada en Markdown, útil para flujos de trabajo de resumen o investigación sin salir de la terminal.
Usa la bandera -d con un endpoint de Azure Document Intelligence para extraer texto de PDFs escaneados o con muchas imágenes que el análisis estándar maneja de forma deficiente.
Convierte archivos de Excel, CSV o JSON en tablas Markdown, haciendo que los datos estructurados sean legibles para personas y estén listos para su análisis o inclusión en informes.
-d para la extracción mejorada de PDF. Proporciona tu endpoint de Azure Cognitive Services mediante la bandera -e.npx clawhub@latest install markdown-converterInicia sesión para escribir una reseña
Aún no hay reseñas. ¡Sé el primero en compartir tu experiencia!