Sag

Name: Sag
Author: Peter Steinberger

通过命令行使用 ElevenLabs AI 语音，提供熟悉的 mac 风格 `say` 界面及富有表现力的音频标签。

Peter Steinbergerv1.0.0

正在连接智能体...

npx clawhub@latest install sag

19当前安装数

603累计安装数

v1.0.0版本

系统要求

ElevenLabs API KeyElevenLabs API Key (sag alias)(optional)Default Voice ID(optional)Default Voice ID (sag alias)(optional)

查看源码(ClawHub)

Sag 技能概述

sag 是一款 CLI 工具，将 ElevenLabs 文字转语音功能带入您的终端，其用户体验灵感来源于 macOS 内置的 say 命令。由 ElevenLabs 最新模型驱动——包括富有表现力的 eleven_v3——它支持本地音频播放、多种声音、情感/语调标签以及精细的发音控制。一次安装，即可从任意文本、脚本或 AI 智能体响应中生成高质量的语音音频。

如何使用

Step 1: 在终端运行或在 AgentCellar 上安装此技能

npx clawhub@latest install sag

或

点击本页顶部的安装按钮即可一键设置

Sag 适用场景

适合使用

您希望从命令行生成富有表现力的高质量 AI 语音音频，而无需编写自定义 API 代码。
您需要 AI 智能体（如 Clawd）使用 [whispers]、[excited] 或 [sarcastic] 等标签，生成带有个性和情感的语音回复。
您正在编写需要选择声音、语言规范化或切换模型（eleven_v3、eleven_multilingual_v2、eleven_flash_v2_5）的 TTS 工作流脚本。
您希望用一个即插即用的替代方案取代 macOS say 命令，改用 ElevenLabs 的高品质声音，而非系统自带声音。

不适合使用

您没有 ElevenLabs API 密钥，或者不想产生 ElevenLabs 使用费用——此技能没有免费/离线回退方案。
您需要 SSML <phoneme> 支持；sag 不提供该功能。
您只需要 macOS 上基本的系统级 TTS，且不需要 ElevenLabs 的质量——内置的 say 命令即可满足需求。

核心功能

多种 ElevenLabs 模型

可在 eleven_v3（富有表现力，默认）、eleven_multilingual_v2（稳定，多语言）和 eleven_flash_v2_5（快速）之间进行选择，以便针对每种使用场景在质量、速度和语言覆盖范围之间取得最佳平衡。

富有表现力的音频标签（v3）

使用 [whispers]、[shouts]、[laughs]、[excited]、[sarcastic] 等标签，将语音提示直接嵌入文本中。停顿控制使用 [pause]、[short pause] 和 [long pause]，而非 SSML。

语音选择与列表

通过 -v 标志按名称或 ID 指定任意 ElevenLabs 语音，通过 ELEVENLABS_VOICE_ID / SAG_VOICE_ID 设置默认语音，并使用 sag voices 浏览可用语音。

发音与规范化控制

通过重新拼写单词、使用连字符或调整大小写来修正错误发音。--normalize auto|off 标志用于处理数字、单位和 URL，而 --lang 则指导特定语言的规范化处理。

特定模型的提示技巧

运行 sag prompting 以获取针对当前所选模型的专属指导，了解如何措辞和格式化文本以获得最佳效果。

输出到文件

使用 -o 标志将生成的音频直接保存到磁盘（例如，-o /tmp/reply.mp3），便于将音频文件附加到 AI 代理响应或下游工作流中。

使用场景

AI 智能体语音回复

AI 智能体生成具有特定角色的语音回复 —— 例如，sag -v Clawd -o /tmp/reply.mp3 "[excited] Here's what I found!" —— 然后在回复中包含文件路径以便立即播放。

脚本化文本转语音旁白

在 shell 脚本中将文本或文档内容传入 sag，批量生成带旁白的音频文件，并利用 --normalize auto 参数整洁地处理数字和 URL。

为内容创作者提供的语音原型工具

在正式确定生产配音之前，通过终端快速试听不同的 ElevenLabs 声音及演绎风格（[whispers]、[sarcastic]、[sings]），轻松做出选择。

多语言音频生成

使用 eleven_multilingual_v2 配合 --lang de|fr|es|... 参数，可生成经过正确规范化处理的非英语语言 TTS 音频，适用于本地化内容流水线。

系统要求

ElevenLabs API 密钥 (必填) — 驱动所有文本转语音生成。设置为 ELEVENLABS_API_KEY（推荐）或 SAG_API_KEY。
默认语音 (可选) — 设置 ELEVENLABS_VOICE_ID 或 SAG_VOICE_ID，以避免在每次调用时指定 -v。

正在连接智能体...

npx clawhub@latest install sag

19当前安装数

603累计安装数

v1.0.0版本

系统要求

ElevenLabs API KeyElevenLabs API Key (sag alias)(optional)Default Voice ID(optional)Default Voice ID (sag alias)(optional)

查看源码(ClawHub)

常见问题

评价

0 条评价

登录后撰写评价

暂无评价。来分享你的使用体验吧！