Openai Whisper

Name: Openai Whisper
Author: Peter Steinberger

使用 OpenAI 的 Whisper 語音轉文字模型在本機轉錄音訊檔案——無需 API 金鑰，支援多種語言和輸出格式。

Peter Steinbergerv1.0.0

正在連線至智能體...

npx clawhub@latest install openai-whisper

161Star 數

31.4k下載次數

84目前安裝數

832累計安裝數

v1.0.0版本

Feb 26, 2026更新時間

查看原始碼(ClawHub)

Openai Whisper 技能概述

Whisper (CLI) 將 OpenAI 強大的語音轉文字模型直接帶到您的電腦上。它能轉錄多種格式的音訊檔案，也可以將語音翻譯成英文——所有處理均在本地完成，無需將資料傳送至外部 API。模型只需下載一次並快取至本地，使後續執行更加快速，且可完全離線使用。

如何使用

Step 1: 在終端機執行或在 AgentCellar 上安裝此技能

npx clawhub@latest install openai-whisper

或

點擊本頁頂部的安裝按鈕即可一鍵設定

When to Use Openai Whisper

Best Fit

您需要在本地轉錄音訊或影片檔案，無需 API 金鑰或使用費用。
您希望進行保護隱私的轉錄，讓音訊永不離開您的裝置。
您需要直接從音訊生成字幕／說明檔案（.srt）。
您正在處理一批錄音，並希望完全掌控模型大小與速度之間的取捨。

When Not to Use

您需要即時或串流轉錄功能 — Whisper CLI 處理的是檔案，而非即時音訊串流。
您需要具備保證可用性與 SLA 的託管雲端轉錄服務。
您的機器磁碟空間或記憶體非常有限，無法容納模型權重（即使是最小的模型也需要數百 MB）。

核心功能

完全本地運行，無需 API 金鑰

Openai Whisper 完全在您自己的硬體上運行。無需 OpenAI 帳號、無需 API 金鑰，也不會將任何資料傳送至外部伺服器——只需一次下載模型權重，即可離線進行語音轉錄。

多種輸出格式

透過 --output_format 旗標，支援 txt、srt、vtt、tsv 和 json 等輸出格式，讓您只需一道指令，即可輕鬆產生字幕、副標題或純文字逐字稿。

翻譯為英文

傳入 --task translate 即可自動將非英語語音翻譯為英文文字，此功能由與語音轉錄相同的模型權重驅動。

靈活的模型選擇

從多種模型中選擇（tiny、base、small、medium、large、turbo），以平衡轉錄速度與準確度。此安裝的預設模型為 turbo。模型在首次下載後會快取於 ~/.cache/whisper。

使用情境

會議或訪談錄音轉文字

將錄製好的 .mp3 或 .m4a 檔案放入 Openai Whisper，並加上 --model medium --output_format txt 參數，即可取得乾淨的文字逐字稿，且無需將敏感對話上傳至第三方服務。

影片字幕生成

使用 --output_format srt 來產生字幕檔案，可直接匯入影片編輯器或媒體播放器，非常適合需要在本地端為錄影內容加上字幕的內容創作者。

多語言音頻翻譯

對外語音頻執行 --task translate，一步驟即可獲得英文逐字稿，適合需要處理多語言原始素材的研究人員或新聞工作者使用。

正在連線至智能體...

npx clawhub@latest install openai-whisper

161Star 數

31.4k下載次數

84目前安裝數

832累計安裝數

v1.0.0版本

Feb 26, 2026更新時間

查看原始碼(ClawHub)

常見問題

評價

0 則評價

登入後撰寫評價

尚無評價。來分享你的使用體驗吧！