通过命令行使用 ElevenLabs AI 语音,提供熟悉的 mac 风格 `say` 界面及富有表现力的音频标签。
npx clawhub@latest install sag系统要求
sag 是一款 CLI 工具,将 ElevenLabs 文字转语音功能带入您的终端,其用户体验灵感来源于 macOS 内置的 say 命令。由 ElevenLabs 最新模型驱动——包括富有表现力的 eleven_v3——它支持本地音频播放、多种声音、情感/语调标签以及精细的发音控制。一次安装,即可从任意文本、脚本或 AI 智能体响应中生成高质量的语音音频。
npx clawhub@latest install sag点击本页顶部的 安装 按钮即可一键设置
[whispers]、[excited] 或 [sarcastic] 等标签,生成带有个性和情感的语音回复。eleven_v3、eleven_multilingual_v2、eleven_flash_v2_5)的 TTS 工作流脚本。say 命令,改用 ElevenLabs 的高品质声音,而非系统自带声音。<phoneme> 支持;sag 不提供该功能。say 命令即可满足需求。可在 eleven_v3(富有表现力,默认)、eleven_multilingual_v2(稳定,多语言)和 eleven_flash_v2_5(快速)之间进行选择,以便针对每种使用场景在质量、速度和语言覆盖范围之间取得最佳平衡。
使用 [whispers]、[shouts]、[laughs]、[excited]、[sarcastic] 等标签,将语音提示直接嵌入文本中。停顿控制使用 [pause]、[short pause] 和 [long pause],而非 SSML。
通过 -v 标志按名称或 ID 指定任意 ElevenLabs 语音,通过 ELEVENLABS_VOICE_ID / SAG_VOICE_ID 设置默认语音,并使用 sag voices 浏览可用语音。
通过重新拼写单词、使用连字符或调整大小写来修正错误发音。--normalize auto|off 标志用于处理数字、单位和 URL,而 --lang 则指导特定语言的规范化处理。
运行 sag prompting 以获取针对当前所选模型的专属指导,了解如何措辞和格式化文本以获得最佳效果。
使用 -o 标志将生成的音频直接保存到磁盘(例如,-o /tmp/reply.mp3),便于将音频文件附加到 AI 代理响应或下游工作流中。
AI 智能体生成具有特定角色的语音回复 —— 例如,sag -v Clawd -o /tmp/reply.mp3 "[excited] Here's what I found!" —— 然后在回复中包含文件路径以便立即播放。
在 shell 脚本中将文本或文档内容传入 sag,批量生成带旁白的音频文件,并利用 --normalize auto 参数整洁地处理数字和 URL。
在正式确定生产配音之前,通过终端快速试听不同的 ElevenLabs 声音及演绎风格([whispers]、[sarcastic]、[sings]),轻松做出选择。
使用 eleven_multilingual_v2 配合 --lang de|fr|es|... 参数,可生成经过正确规范化处理的非英语语言 TTS 音频,适用于本地化内容流水线。
ELEVENLABS_API_KEY(推荐)或 SAG_API_KEY。ELEVENLABS_VOICE_ID 或 SAG_VOICE_ID,以避免在每次调用时指定 -v。npx clawhub@latest install sag系统要求
登录后撰写评价
暂无评价。来分享你的使用体验吧!