Конвертируйте PDF-файлы, документы Office, изображения, аудио, YouTube-ссылки и многое другое в чистый Markdown — без установки.
npx clawhub@latest install markdown-converterMarkdown Converter преобразует практически любой формат файлов в чистый, структурированный Markdown с помощью markitdown — запускаемого через uvx без предварительной установки. Он обрабатывает всё: от PDF и документов Office до изображений с OCR, аудио с транскрипцией, ZIP-архивов и даже URL-адресов YouTube. Результат сохраняет структуру документа (заголовки, таблицы, списки, ссылки), что делает его идеальным для подачи контента в LLM или конвейеры текстового анализа.
npx clawhub@latest install markdown-converterНажмите кнопку Установить вверху страницы для настройки в один клик
Конвертирует PDF, Word (.docx), PowerPoint (.pptx), Excel (.xlsx/.xls), HTML, CSV, JSON, XML, изображения, аудио, ZIP-архивы, ссылки YouTube и файлы EPub — всё в Markdown.
Использует uvx markitdown для запуска без глобальной установки. Зависимости загружаются и кэшируются при первом запуске; последующие запуски выполняются значительно быстрее.
Преобразованный Markdown сохраняет структуру документа, включая заголовки, таблицы, маркированные списки и ссылки — что делает последующую обработку с помощью LLM или текстовый анализ более точными.
Извлекает EXIF-метаданные и выполняет OCR на изображениях, а также транскрибирует аудиофайлы, встраивая результаты непосредственно в вывод Markdown Converter.
Для сложных или отсканированных PDF-файлов с неудовлетворительным качеством извлечения по умолчанию флаг -d включает Azure Document Intelligence через настраиваемую конечную точку для получения результатов более высокого качества.
Поддерживает пути к файлам, передачу через stdin и вывод в stdout — с дополнительными флагами для указания расширения файла, MIME-типа и кодировки для неоднозначных входных данных.
Конвертируйте папку с PDF и документами Word в Markdown перед подачей их в систему поиска с дополненной генерацией (RAG) с помощью Markdown Converter, сохраняя структуру, чтобы модель могла выполнять логические операции с заголовками и таблицами.
Передайте URL YouTube напрямую в Markdown Converter, чтобы получить структурированный транскрипт в формате Markdown — это удобно для задач суммаризации или исследовательских рабочих процессов без необходимости покидать терминал.
Используйте флаг -d вместе с конечной точкой Azure Document Intelligence для извлечения текста из сканированных PDF-файлов или PDF-файлов с большим количеством изображений, с которыми стандартный парсинг справляется плохо.
Преобразуйте файлы Excel, CSV или JSON в таблицы Markdown с помощью Markdown Converter, делая структурированные данные удобочитаемыми и готовыми к анализу или включению в отчёты.
-d для расширенного извлечения данных из PDF. Укажите конечную точку Azure Cognitive Services с помощью флага -e.npx clawhub@latest install markdown-converterВойдите, чтобы написать отзыв
Отзывов пока нет. Будьте первым, кто поделится своим опытом!