將 PDF、Office 文件、圖片、音訊、YouTube 網址等轉換為簡潔的 Markdown — 無需安裝。
Markdown Converter 能將幾乎任何檔案格式轉換為整潔、結構化的 Markdown,底層使用 markitdown——透過 uvx 呼叫,無需預先安裝。它支援從 PDF 和 Office 文件,到帶有 OCR 的圖片、帶有轉錄功能的音訊、ZIP 壓縮檔,甚至 YouTube 網址等各種格式。輸出內容會保留文件結構(標題、表格、清單、連結),非常適合用於將內容輸入 LLM 或文字分析流程。
npx clawhub@latest install markdown-converter點擊本頁頂部的 安裝 按鈕即可一鍵設定
可將 PDF、Word(.docx)、PowerPoint(.pptx)、Excel(.xlsx/.xls)、HTML、CSV、JSON、XML、圖片、音訊、ZIP 壓縮檔、YouTube 網址及 EPub 檔案,全部轉換為 Markdown。
使用 uvx markitdown 執行,無需進行全域安裝步驟。相依套件會在首次執行時自動下載並快取;後續執行速度將顯著加快。
轉換後的 Markdown 保留文件結構,包括標題、表格、項目清單和連結——使後續的 LLM 擷取或文字分析更加精確。
從圖片中提取 EXIF 元資料並執行 OCR 辨識,同時轉錄音訊檔案,將結果直接嵌入 Markdown Converter 的 Markdown 輸出中。
對於預設擷取效果不佳的複雜或掃描 PDF,-d 旗標可透過可設定的端點啟用 Azure Document Intelligence,以獲得更高品質的結果。
支援檔案路徑、stdin 管道傳輸及 stdout,並提供可選旗標,用於在輸入內容不明確時提示副檔名、MIME 類型與字元集。
在將一批 PDF 和 Word 文件饋入檢索增強生成(RAG)系統之前,先使用 Markdown Converter 將整個資料夾的文件轉換為 Markdown,同時保留文件結構,讓模型能夠對標題與表格進行推理。
直接將 YouTube 網址傳入 Markdown Converter,即可取得結構化的 Markdown 逐字稿,適合在不離開終端機的情況下進行摘要整理或研究工作流程。
使用 -d 旗標搭配 Azure Document Intelligence 端點,從標準解析效果不佳的掃描或含大量圖片的 PDF 中提取文字。
將 Excel、CSV 或 JSON 檔案轉換為 Markdown 表格,使結構化資料更易於閱讀,並可直接用於分析或納入報告中。
-d 旗標進行增強型 PDF 擷取時才需要。請透過 -e 旗標提供您的 Azure 認知服務端點。登入後撰寫評價
尚無評價。來分享你的使用體驗吧!