Markdown Converter

Name: Markdown Converter
Author: Peter Steinberger

将 PDF、Office 文档、图片、音频、YouTube 链接等转换为整洁的 Markdown——无需安装任何软件。

Peter Steinbergerv1.0.0

正在连接智能体...

npx clawhub@latest install markdown-converter

72当前安装数

109累计安装数

v1.0.0版本

查看源码(ClawHub)

Markdown Converter 技能概述

Markdown Converter 可将几乎任何文件格式转换为整洁、结构化的 Markdown，底层使用 markitdown 实现——通过 uvx 调用，无需预先安装。它支持处理从 PDF、Office 文档到带 OCR 的图片、带转录的音频、ZIP 压缩包，乃至 YouTube URL 等各类内容。输出结果会保留文档结构（标题、表格、列表、链接），非常适合将内容输送至 LLM 或文本分析流水线中使用。

如何使用

Step 1: 在终端运行或在 AgentCellar 上安装此技能

npx clawhub@latest install markdown-converter

或

点击本页顶部的安装按钮即可一键设置

Markdown Converter 适用场景

适合使用

您需要将 Office 文档（Word、Excel、PowerPoint）或 PDF 转换为 Markdown，以便在 LLM 或 RAG 流水线中使用。
您希望从图像中提取文本和元数据（EXIF + OCR），或将音频文件转录为 Markdown。
您需要批量处理 ZIP 压缩包中的文件，一次性将所有内容转换为 Markdown。
您希望将 YouTube 链接中的字幕内容提取为结构化 Markdown，无需手动复制粘贴。

不适合使用

您需要将 Markdown 反向转换为其他格式（例如 PDF 或 DOCX）——此技能是单向的。
您需要像素级的布局保留；对于格式复杂的文档，转换为 Markdown 本质上会造成信息损失。

核心功能

广泛的格式支持

支持将 PDF、Word（.docx）、PowerPoint（.pptx）、Excel（.xlsx/.xls）、HTML、CSV、JSON、XML、图片、音频、ZIP 压缩包、YouTube 链接以及 EPub 文件全部转换为 Markdown 格式。

无需安装

使用 uvx markitdown 运行，无需全局安装步骤。依赖项在首次运行时自动获取并缓存，后续运行速度将显著提升。

保留结构的输出

转换后的 Markdown 保留文档结构，包括标题、表格、项目符号列表和链接——使后续的 LLM 摄取或文本分析更加准确。

图像 OCR 与音频转录

提取图像的 EXIF 元数据并对其进行 OCR 识别，同时转录音频文件，将结果直接嵌入 Markdown Converter 的 Markdown 输出中。

Azure Document Intelligence 集成

对于默认提取效果较差的复杂或扫描版 PDF，-d 标志可通过可配置的端点启用 Azure Document Intelligence，从而获得更高质量的提取结果。

灵活的输入/输出模式

支持文件路径、标准输入管道（stdin）及标准输出（stdout）——并提供可选标志，用于在输入内容存在歧义时指定文件扩展名、MIME 类型和字符集。

使用场景

LLM 文档摄取管道

在将 PDF 和 Word 文档文件夹中的内容输入检索增强生成（RAG）系统之前，使用 Markdown Converter 将其转换为 Markdown 格式，同时保留文档结构，以便模型能够对标题和表格进行推理分析。

YouTube 视频字幕提取

将 YouTube 链接直接传递给 Markdown Converter，即可获取结构化的 Markdown 字幕内容，无需离开终端，便于摘要整理或研究工作流使用。

使用 Azure AI 从扫描 PDF 中提取内容

使用 -d 标志配合 Azure Document Intelligence 端点，可从扫描件或图像较多的 PDF 中提取文本——此类文件通常难以通过标准解析方式处理。

电子表格和数据文件规范化

将 Excel、CSV 或 JSON 文件转换为 Markdown 表格，使结构化数据易于阅读，便于分析或纳入报告。

系统要求

Azure Document Intelligence Endpoint (可选) — 仅在使用 -d 标志进行增强型 PDF 提取时需要。通过 -e 标志提供您的 Azure Cognitive Services 端点。

正在连接智能体...

npx clawhub@latest install markdown-converter

72当前安装数

109累计安装数

v1.0.0版本

查看源码(ClawHub)

常见问题

评价

0 条评价

登录后撰写评价

暂无评价。来分享你的使用体验吧！