Используйте голоса ElevenLabs AI из командной строки с привычным mac-интерфейсом `say` и выразительными аудио-тегами.
npx clawhub@latest install sagТребования
Sag — это CLI-инструмент, который интегрирует технологию преобразования текста в речь от ElevenLabs в ваш терминал с UX, вдохновлённым встроенной командой say в macOS. Работая на основе новейших моделей ElevenLabs — включая выразительную eleven_v3 — он поддерживает локальное воспроизведение аудио, несколько голосов, теги эмоций и интонации, а также тонкое управление произношением. Установите его один раз и генерируйте высококачественный синтезированный звук из любого текста, скрипта или ответа ИИ-агента.
npx clawhub@latest install sagНажмите кнопку Установить вверху страницы для настройки в один клик
[whispers], [excited] или [sarcastic].eleven_v3, eleven_multilingual_v2, eleven_flash_v2_5).say «из коробки», которая использует премиум-голоса ElevenLabs вместо системных.<phoneme>; Sag не предоставляет эту функцию.say будет достаточно.Выбирайте между eleven_v3 (выразительная, по умолчанию), eleven_multilingual_v2 (стабильная, многоязычная) и eleven_flash_v2_5 (быстрая), чтобы найти оптимальный баланс между качеством, скоростью и охватом языков для каждого варианта использования.
Встраивайте подсказки воспроизведения прямо в текст с помощью тегов, таких как [whispers], [shouts], [laughs], [excited], [sarcastic] и других. Управление паузами осуществляется с помощью [pause], [short pause] и [long pause] вместо SSML.
Укажите любой голос ElevenLabs по имени или ID с помощью флага -v, задайте голос по умолчанию через ELEVENLABS_VOICE_ID / SAG_VOICE_ID, а также просматривайте доступные голоса с помощью команды sag voices.
Исправляйте неправильное произношение, изменяя написание слов, используя дефисы или регулируя регистр. Флаг --normalize auto|off управляет нормализацией чисел, единиц измерения и URL-адресов, а --lang направляет языковую нормализацию.
Запустите sag prompting, чтобы получить рекомендации по формулировке и форматированию текста для достижения наилучших результатов с текущей выбранной моделью.
Сохраняйте сгенерированное аудио прямо на диск с помощью флага -o (например, -o /tmp/reply.mp3), что упрощает прикрепление аудиофайлов к ответам ИИ-агентов или последующим рабочим процессам.
ИИ-агент генерирует голосовой ответ с определённым характером — например, sag -v Clawd -o /tmp/reply.mp3 "[excited] Here's what I found!" — затем включает путь к файлу в свой ответ для немедленного воспроизведения.
Передавайте текст или содержимое документов в sag через shell-скрипт для массового создания озвученных аудиофайлов, используя --normalize auto для корректной обработки чисел и URL-адресов.
Быстро прослушивайте различные голоса ElevenLabs и стили подачи ([whispers], [sarcastic], [sings]) перед тем, как остановиться на финальном голосе для озвучки — всё прямо из терминала.
Используйте eleven_multilingual_v2 с --lang de|fr|es|... для генерации корректно нормализованного TTS на языках, отличных от английского, — подходит для конвейеров локализованного контента.
ELEVENLABS_API_KEY (рекомендуется) или SAG_API_KEY.ELEVENLABS_VOICE_ID или SAG_VOICE_ID, чтобы не указывать -v при каждом вызове.npx clawhub@latest install sagТребования
Войдите, чтобы написать отзыв
Отзывов пока нет. Будьте первым, кто поделится своим опытом!