使用 OpenAI 的 Whisper API 將音訊檔案轉錄為文字——透過簡單的 CLI 支援多種格式、語言及輸出選項。
npx clawhub@latest install openai-whisper-api系統需求
openai-whisper-api 是一個將 OpenAI 的 /v1/audio/transcriptions 端點(Whisper)封裝成簡易 Shell 腳本的技能。只需指定任意音訊檔案,即可在數秒內取得純文字逐字稿。它透過命令列旗標支援模型選擇、語言提示、自訂輸出路徑以及 JSON 輸出等功能。
npx clawhub@latest install openai-whisper-api點擊本頁頂部的 安裝 按鈕即可一鍵設定
.m4a、.ogg),需要快速轉錄,而不想自行撰寫自訂 API 整合程式碼。OPENAI_API_KEY,因為此技能沒有其他可替代的轉錄後端。只需執行一個 shell 腳本,並提供音訊檔案的路徑,預設情況下即可在同一位置獲得一份 .txt 文字稿。無需任何樣板 API 程式碼。
使用 --out 將輸出寫入自訂路徑,或透過 --json 向 API 請求原始 JSON 以供後續處理。
使用 --language 指定口說語言(例如 en)以提升辨識準確度,或使用 --prompt 提供說話者姓名等背景資訊,協助引導 openai-whisper-api 進行轉錄。
預設為 whisper-1,但接受 --model 旗標,讓您隨時準備好因應 OpenAI 未來推出的 Whisper 模型變體。
錄製會議或訪談內容,然後對音訊檔案執行此技能,即可產生完整的文字逐字稿。傳入 --prompt 參數並附上參與者姓名,以提升輸出結果中說話者名稱的辨識準確度。
將腳本整合至 cron 排程任務或 CI 工作流程中,自動從指定目錄擷取新的音訊檔案並進行轉錄,並將結果寫入指定的輸出資料夾。使用 openai-whisper-api 可讓整個流程無需人工介入,全自動完成音訊轉文字的作業。
透過對一批音訊檔案執行 openai-whisper-api 腳本,將語音備忘錄或 Podcast 集數的資料庫轉換為可搜尋的文字檔案。
/v1/audio/transcriptions 發送的請求。可透過 OPENAI_API_KEY 環境變數或在 ~/.openclaw/openclaw.json 中設定。npx clawhub@latest install openai-whisper-api系統需求
登入後撰寫評價
尚無評價。來分享你的使用體驗吧!