Browser & Automation☁️

openai-whisper-api

Name: openai-whisper-api
Author: OpenClaw

精選

使用 OpenAI 的 Whisper API 將音訊檔案轉錄為文字——透過簡單的 CLI 支援多種格式、語言及輸出選項。

作者 OpenClawv1.0.0

正在連線至智能體...

npx clawhub@latest install openai-whisper-api

239目前安裝數

v1.0.0版本

系統需求

curlOpenAI API Key

openai-whisper-api 技能概述

openai-whisper-api 是一個將 OpenAI 的 /v1/audio/transcriptions 端點（Whisper）封裝成簡易 Shell 腳本的技能。只需指定任意音訊檔案，即可在數秒內取得純文字逐字稿。它透過命令列旗標支援模型選擇、語言提示、自訂輸出路徑以及 JSON 輸出等功能。

如何使用

Step 1: 在終端機執行或在 AgentCellar 上安裝此技能

npx clawhub@latest install openai-whisper-api

或

點擊本頁頂部的安裝按鈕即可一鍵設定

When to Use openai-whisper-api

Best Fit

您有音訊檔案（例如 .m4a、.ogg），需要快速轉錄，而不想自行撰寫自訂 API 整合程式碼。
您希望將轉錄作業自動化，納入 shell 管線或腳本化工作流程中。
您需要傳入語言提示或說話者名稱提示，以提升轉錄準確度。
您希望從 Whisper API 取得結構化的 JSON 輸出，而非純文字。

When Not to Use

您需要即時或串流轉錄功能——此技能會將完整的音訊檔案傳送至 API，不適合用於即時音訊。
您不願意設定 OPENAI_API_KEY，因為此技能沒有其他可替代的轉錄後端。

核心功能

簡單的單一指令轉錄

只需執行一個 shell 腳本，並提供音訊檔案的路徑，預設情況下即可在同一位置獲得一份 .txt 文字稿。無需任何樣板 API 程式碼。

靈活的輸出選項

使用 --out 將輸出寫入自訂路徑，或透過 --json 向 API 請求原始 JSON 以供後續處理。

語言與提示詞設定

使用 --language 指定口說語言（例如 en）以提升辨識準確度，或使用 --prompt 提供說話者姓名等背景資訊，協助引導 openai-whisper-api 進行轉錄。

模型選擇

預設為 whisper-1，但接受 --model 旗標，讓您隨時準備好因應 OpenAI 未來推出的 Whisper 模型變體。

使用情境

會議或訪談轉錄

錄製會議或訪談內容，然後對音訊檔案執行此技能，即可產生完整的文字逐字稿。傳入 --prompt 參數並附上參與者姓名，以提升輸出結果中說話者名稱的辨識準確度。

自動化轉錄流程

將腳本整合至 cron 排程任務或 CI 工作流程中，自動從指定目錄擷取新的音訊檔案並進行轉錄，並將結果寫入指定的輸出資料夾。使用 openai-whisper-api 可讓整個流程無需人工介入，全自動完成音訊轉文字的作業。

Podcast 或語音備忘錄封存

透過對一批音訊檔案執行 openai-whisper-api 腳本，將語音備忘錄或 Podcast 集數的資料庫轉換為可搜尋的文字檔案。

系統需求

OpenAI API Key (必填) — 用於驗證向 /v1/audio/transcriptions 發送的請求。可透過 OPENAI_API_KEY 環境變數或在 ~/.openclaw/openclaw.json 中設定。

正在連線至智能體...

npx clawhub@latest install openai-whisper-api

239目前安裝數

v1.0.0版本

系統需求

curlOpenAI API Key

常見問題

評價

0 則評價

登入後撰寫評價

尚無評價。來分享你的使用體驗吧！