Sag

Name: Sag
Author: Peter Steinberger

Используйте голоса ElevenLabs AI из командной строки с привычным mac-интерфейсом `say` и выразительными аудио-тегами.

Peter Steinbergerv1.0.0

Подключение к агенту...

npx clawhub@latest install sag

19Текущие установки

603Всего установок

v1.0.0Версия

Требования

ElevenLabs API KeyElevenLabs API Key (sag alias)(optional)Default Voice ID(optional)Default Voice ID (sag alias)(optional)

Просмотр исходного кода(ClawHub)

Обзор скилла Sag

Sag — это CLI-инструмент, который интегрирует технологию преобразования текста в речь от ElevenLabs в ваш терминал с UX, вдохновлённым встроенной командой say в macOS. Работая на основе новейших моделей ElevenLabs — включая выразительную eleven_v3 — он поддерживает локальное воспроизведение аудио, несколько голосов, теги эмоций и интонации, а также тонкое управление произношением. Установите его один раз и генерируйте высококачественный синтезированный звук из любого текста, скрипта или ответа ИИ-агента.

Как использовать

Step 1: Запустите в терминале или установите этот скилл на AgentCellar

npx clawhub@latest install sag

или

Нажмите кнопку Установить вверху страницы для настройки в один клик

When to Use Sag

Best Fit

Вы хотите генерировать выразительное высококачественное голосовое аудио с помощью ИИ из командной строки, не написывая собственный код для работы с API.
Вам нужен ИИ-агент (например, Clawd), чтобы создавать озвученные голосовые ответы с характером и эмоциями, используя теги вроде [whispers], [excited] или [sarcastic].
Вы создаёте сценарии TTS-процессов, требующих выбора голоса, нормализации языка или переключения моделей (eleven_v3, eleven_multilingual_v2, eleven_flash_v2_5).
Вы хотите замену macOS say «из коробки», которая использует премиум-голоса ElevenLabs вместо системных.

When Not to Use

У вас нет API-ключа ElevenLabs или вы не хотите нести расходы за использование ElevenLabs — этот навык не имеет бесплатного или офлайн-варианта.
Вам нужна поддержка SSML <phoneme>; Sag не предоставляет эту функцию.
Вам нужен только базовый системный TTS на macOS и не требуется качество ElevenLabs — встроенной команды say будет достаточно.

Ключевые возможности

Несколько моделей ElevenLabs

Выбирайте между eleven_v3 (выразительная, по умолчанию), eleven_multilingual_v2 (стабильная, многоязычная) и eleven_flash_v2_5 (быстрая), чтобы найти оптимальный баланс между качеством, скоростью и охватом языков для каждого варианта использования.

Выразительные аудио-теги (v3)

Встраивайте подсказки воспроизведения прямо в текст с помощью тегов, таких как [whispers], [shouts], [laughs], [excited], [sarcastic] и других. Управление паузами осуществляется с помощью [pause], [short pause] и [long pause] вместо SSML.

Выбор и просмотр голосов

Укажите любой голос ElevenLabs по имени или ID с помощью флага -v, задайте голос по умолчанию через ELEVENLABS_VOICE_ID / SAG_VOICE_ID, а также просматривайте доступные голоса с помощью команды sag voices.

Управление произношением и нормализацией

Исправляйте неправильное произношение, изменяя написание слов, используя дефисы или регулируя регистр. Флаг --normalize auto|off управляет нормализацией чисел, единиц измерения и URL-адресов, а --lang направляет языковую нормализацию.

Советы по составлению запросов для конкретных моделей

Запустите sag prompting, чтобы получить рекомендации по формулировке и форматированию текста для достижения наилучших результатов с текущей выбранной моделью.

Вывод в файл

Сохраняйте сгенерированное аудио прямо на диск с помощью флага -o (например, -o /tmp/reply.mp3), что упрощает прикрепление аудиофайлов к ответам ИИ-агентов или последующим рабочим процессам.

Сценарии использования

Голосовые ответы ИИ-агента

ИИ-агент генерирует голосовой ответ с определённым характером — например, sag -v Clawd -o /tmp/reply.mp3 "[excited] Here's what I found!" — затем включает путь к файлу в свой ответ для немедленного воспроизведения.

Скриптовое TTS-повествование

Передавайте текст или содержимое документов в sag через shell-скрипт для массового создания озвученных аудиофайлов, используя --normalize auto для корректной обработки чисел и URL-адресов.

Голосовое прототипирование для создателей контента

Быстро прослушивайте различные голоса ElevenLabs и стили подачи ([whispers], [sarcastic], [sings]) перед тем, как остановиться на финальном голосе для озвучки — всё прямо из терминала.

Многоязычная генерация аудио

Используйте eleven_multilingual_v2 с --lang de|fr|es|... для генерации корректно нормализованного TTS на языках, отличных от английского, — подходит для конвейеров локализованного контента.

Требования

Ключ API ElevenLabs (обязательно) — Обеспечивает генерацию текста в речь. Задайте как ELEVENLABS_API_KEY (рекомендуется) или SAG_API_KEY.
Голос по умолчанию (необязательно) — Задайте ELEVENLABS_VOICE_ID или SAG_VOICE_ID, чтобы не указывать -v при каждом вызове.

Подключение к агенту...

npx clawhub@latest install sag

19Текущие установки

603Всего установок

v1.0.0Версия

Требования

ElevenLabs API KeyElevenLabs API Key (sag alias)(optional)Default Voice ID(optional)Default Voice ID (sag alias)(optional)

Просмотр исходного кода(ClawHub)

Часто задаваемые вопросы

Отзывы

0 отзывов

Войдите, чтобы написать отзыв

Отзывов пока нет. Будьте первым, кто поделится своим опытом!