透過熟悉的 Mac 風格 `say` 介面與表情音訊標籤,在命令列中使用 ElevenLabs AI 語音。
npx clawhub@latest install sag系統需求
sag 是一款 CLI 工具,將 ElevenLabs 的文字轉語音功能帶入您的終端機,其使用者體驗靈感來自 macOS 內建的 say 指令。由 ElevenLabs 最新模型驅動——包括富有表現力的 eleven_v3——支援本地音訊播放、多種語音、情緒/表達標籤,以及精細的發音控制。只需安裝一次,即可從任何文字、腳本或 AI 代理回應中生成高品質的語音音訊。
npx clawhub@latest install sag點擊本頁頂部的 安裝 按鈕即可一鍵設定
[whispers]、[excited] 或 [sarcastic] 等標籤,產生具有個性與情感的語音回覆。eleven_v3、eleven_multilingual_v2、eleven_flash_v2_5)的 TTS 工作流程腳本。say 指令,取代系統語音。<phoneme> 支援;Sag 並未提供該功能。say 指令即已足夠。可在 eleven_v3(富有表現力,預設)、eleven_multilingual_v2(穩定、多語言)和 eleven_flash_v2_5(快速)之間選擇,以針對每種使用情境在品質、速度和語言涵蓋範圍之間取得最佳平衡。
使用 [whispers]、[shouts]、[laughs]、[excited]、[sarcastic] 等標籤,直接在文字中嵌入語音提示。暫停控制使用 [pause]、[short pause] 和 [long pause],而非 SSML。
使用 -v 旗標依名稱或 ID 指定任何 ElevenLabs 語音,透過 ELEVENLABS_VOICE_ID / SAG_VOICE_ID 設定預設語音,並使用 sag voices 瀏覽可用的語音。
透過重新拼寫單字、使用連字號或調整大小寫來修正發音錯誤。--normalize auto|off 旗標用於處理數字、單位與網址,而 --lang 則引導特定語言的正規化處理。
執行 sag prompting 以獲取針對當前所選模型的專屬指引,了解如何措辭和格式化文字以達到最佳效果。
使用 -o 旗標將生成的音訊直接儲存至磁碟(例如:-o /tmp/reply.mp3),讓您輕鬆將音訊檔案附加至 AI 代理回應或後續工作流程中。
AI 代理以特定角色生成語音回覆——例如 sag -v Clawd -o /tmp/reply.mp3 "[excited] Here's what I found!" ——然後在回覆中附上檔案路徑以供立即播放。
在 Shell 腳本中將文字或文件內容傳入 sag,以批量產生旁白音訊檔案,並利用 --normalize auto 選項來整潔地處理數字與網址。
在確定正式配音之前,直接從終端機快速試聽不同的 ElevenLabs 聲音與表達風格([whispers]、[sarcastic]、[sings]),省時又高效。
使用 eleven_multilingual_v2 搭配 --lang de|fr|es|... 參數,以生成英語以外語言的正確標準化 TTS 音頻,適合用於本地化內容處理流程。
ELEVENLABS_API_KEY(建議)或 SAG_API_KEY。ELEVENLABS_VOICE_ID 或 SAG_VOICE_ID,以避免每次呼叫時都需要指定 -v。npx clawhub@latest install sag系統需求
登入後撰寫評價
尚無評價。來分享你的使用體驗吧!