Convertissez des PDF, des documents Office, des images, des fichiers audio, des URL YouTube et bien plus encore en Markdown propre — aucune installation requise.
npx clawhub@latest install markdown-converterMarkdown Converter transforme pratiquement n'importe quel format de fichier en Markdown propre et structuré grâce à markitdown — invoqué via uvx sans installation préalable. Il gère tout, des PDFs et documents Office aux images avec OCR, en passant par l'audio avec transcription, les archives ZIP et même les URLs YouTube. La sortie préserve la structure du document (titres, tableaux, listes, liens), ce qui le rend idéal pour alimenter des LLMs ou des pipelines d'analyse de texte.
npx clawhub@latest install markdown-converterCliquez sur le bouton Installer en haut de cette page pour une configuration en un clic
Convertit les fichiers PDF, Word (.docx), PowerPoint (.pptx), Excel (.xlsx/.xls), HTML, CSV, JSON, XML, images, audio, archives ZIP, URLs YouTube et fichiers EPub — le tout en Markdown.
Utilise uvx markitdown pour fonctionner sans étape d'installation globale. Les dépendances sont récupérées et mises en cache lors de la première exécution ; les exécutions suivantes sont nettement plus rapides.
Le Markdown converti conserve la structure du document, notamment les titres, les tableaux, les listes à puces et les liens — ce qui rend l'ingestion par les LLM en aval ou l'analyse de texte plus précise.
Extrait les métadonnées EXIF et exécute la reconnaissance optique de caractères (OCR) sur les images, et transcrit les fichiers audio, en intégrant les résultats directement dans la sortie Markdown.
Pour les PDF complexes ou numérisés avec une extraction par défaut médiocre, le drapeau -d active Azure Document Intelligence via un point de terminaison configurable pour des résultats de meilleure qualité.
Prend en charge les chemins de fichiers, la redirection stdin et stdout — avec des indicateurs optionnels pour préciser l'extension de fichier, le type MIME et le jeu de caractères pour les entrées ambiguës.
Convertissez un dossier de fichiers PDF et Word en Markdown avant de les intégrer dans un système de génération augmentée par récupération (RAG) grâce à Markdown Converter, en préservant la structure afin que le modèle puisse raisonner sur les titres et les tableaux.
Passez directement une URL YouTube au convertisseur pour récupérer une transcription Markdown structurée, utile pour les flux de travail de résumé ou de recherche sans quitter le terminal.
Utilisez le flag -d avec un point de terminaison Azure Document Intelligence pour extraire le texte de PDF numérisés ou contenant beaucoup d'images, que l'analyse standard gère mal.
Convertissez des fichiers Excel, CSV ou JSON en tableaux Markdown, rendant les données structurées lisibles par l'humain et prêtes à être analysées ou intégrées dans des rapports.
-d pour l'extraction PDF améliorée. Fournissez votre endpoint Azure Cognitive Services via le flag -e.npx clawhub@latest install markdown-converterSe connecter pour écrire un avis
Aucun avis pour l'instant. Soyez le premier à partager votre expérience !