使用 OpenAI 的 Whisper 語音轉文字模型在本機轉錄音訊檔案——無需 API 金鑰,支援多種語言和輸出格式。
npx clawhub@latest install openai-whisperWhisper (CLI) 將 OpenAI 強大的語音轉文字模型直接帶到您的電腦上。它能轉錄多種格式的音訊檔案,也可以將語音翻譯成英文——所有處理均在本地完成,無需將資料傳送至外部 API。模型只需下載一次並快取至本地,使後續執行更加快速,且可完全離線使用。
npx clawhub@latest install openai-whisper點擊本頁頂部的 安裝 按鈕即可一鍵設定
.srt)。Openai Whisper 完全在您自己的硬體上運行。無需 OpenAI 帳號、無需 API 金鑰,也不會將任何資料傳送至外部伺服器——只需一次下載模型權重,即可離線進行語音轉錄。
透過 --output_format 旗標,支援 txt、srt、vtt、tsv 和 json 等輸出格式,讓您只需一道指令,即可輕鬆產生字幕、副標題或純文字逐字稿。
傳入 --task translate 即可自動將非英語語音翻譯為英文文字,此功能由與語音轉錄相同的模型權重驅動。
從多種模型中選擇(tiny、base、small、medium、large、turbo),以平衡轉錄速度與準確度。此安裝的預設模型為 turbo。模型在首次下載後會快取於 ~/.cache/whisper。
將錄製好的 .mp3 或 .m4a 檔案放入 Openai Whisper,並加上 --model medium --output_format txt 參數,即可取得乾淨的文字逐字稿,且無需將敏感對話上傳至第三方服務。
使用 --output_format srt 來產生字幕檔案,可直接匯入影片編輯器或媒體播放器,非常適合需要在本地端為錄影內容加上字幕的內容創作者。
對外語音頻執行 --task translate,一步驟即可獲得英文逐字稿,適合需要處理多語言原始素材的研究人員或新聞工作者使用。
npx clawhub@latest install openai-whisper登入後撰寫評價
尚無評價。來分享你的使用體驗吧!