Sag

Name: Sag
Author: Peter Steinberger

Usa voces de IA de ElevenLabs desde la línea de comandos con una interfaz `say` al estilo Mac familiar y etiquetas de audio expresivas.

Peter Steinbergerv1.0.0

Conectando a tu agente...

npx clawhub@latest install sag

19Instalaciones actuales

603Instalaciones totales

v1.0.0Versión

Requisitos

ElevenLabs API KeyElevenLabs API Key (sag alias)(optional)Default Voice ID(optional)Default Voice ID (sag alias)(optional)

Ver código fuente(ClawHub)

Descripción del skill Sag

Sag es una herramienta de CLI que lleva la síntesis de voz de ElevenLabs a tu terminal con una experiencia de usuario inspirada en el comando say integrado en macOS. Impulsada por los últimos modelos de ElevenLabs — incluyendo el expresivo eleven_v3 — admite reproducción de audio local, múltiples voces, etiquetas de emoción/entonación y control detallado de pronunciación. Instálala una vez y genera audio hablado de alta calidad a partir de cualquier texto, script o respuesta de un agente de IA.

Cómo usarlo

Step 1: Ejecuta en tu terminal o instala este skill en AgentCellar

npx clawhub@latest install sag

Haz clic en el botón Instalar en la parte superior de esta página para una configuración rápida

When to Use Sag

Best Fit

Quieres generar audio de voz con IA expresivo y de alta calidad desde la línea de comandos sin escribir código API personalizado.
Necesitas que un agente de IA (como Clawd) produzca respuestas de voz hablada con carácter y emoción, usando etiquetas como [whispers], [excited] o [sarcastic].
Estás creando scripts de flujos de trabajo TTS que requieren selección de voz, normalización de idioma o cambio de modelo (eleven_v3, eleven_multilingual_v2, eleven_flash_v2_5).
Quieres un reemplazo directo para el comando say de macOS que utilice voces premium de ElevenLabs en lugar de las voces del sistema.

When Not to Use

No tienes una clave de API de ElevenLabs o no quieres incurrir en costos de uso de ElevenLabs — esta habilidad no tiene alternativa gratuita ni sin conexión.
Necesitas compatibilidad con <phoneme> de SSML; Sag no expone esa función.
Solo necesitas TTS básico a nivel de sistema en macOS y no requieres la calidad de ElevenLabs — el comando integrado say es suficiente.

Características principales

Múltiples Modelos de ElevenLabs

Elige entre eleven_v3 (expresivo, predeterminado), eleven_multilingual_v2 (estable, multilingüe) y eleven_flash_v2_5 (rápido) para equilibrar calidad, velocidad y cobertura de idiomas en cada caso de uso.

Etiquetas de Audio Expresivas (v3)

Incorpora señales de entrega directamente en tu texto usando etiquetas como [whispers], [shouts], [laughs], [excited], [sarcastic] y más. El control de pausas utiliza [pause], [short pause] y [long pause] en lugar de SSML.

Selección y listado de voces

Especifica cualquier voz de ElevenLabs por nombre o ID con la bandera -v, establece una predeterminada mediante ELEVENLABS_VOICE_ID / SAG_VOICE_ID, y explora las voces disponibles con sag voices.

Controles de pronunciación y normalización

Corrige errores de pronunciación deletreando palabras de nuevo, usando guiones o ajustando el uso de mayúsculas. El indicador --normalize auto|off maneja números, unidades y URLs, mientras que --lang orienta la normalización específica del idioma.

Consejos de Prompting Específicos para el Modelo

Ejecuta sag prompting para obtener orientación específica del modelo sobre cómo formular y formatear el texto para obtener los mejores resultados con el modelo seleccionado actualmente.

Guardar en archivo

Guarda el audio generado directamente en el disco con la marca -o (por ejemplo, -o /tmp/reply.mp3), facilitando la incorporación de archivos de audio en respuestas de agentes de IA o flujos de trabajo posteriores.

Casos de uso

Respuestas de voz del agente de IA

Un agente de IA genera una respuesta hablada con un carácter específico — por ejemplo, sag -v Clawd -o /tmp/reply.mp3 "[excited] Here's what I found!" — y luego incluye la ruta del archivo en su respuesta para reproducción inmediata.

Narración TTS con scripts

Proporciona texto o contenido de documentos a sag en un script de shell para producir archivos de audio narrados en masa, aprovechando --normalize auto para manejar números y URLs de forma limpia.

Prototipado de voz para creadores de contenido

Audita rápidamente diferentes voces y estilos de entrega de ElevenLabs ([whispers], [sarcastic], [sings]) antes de comprometerte con una locución de producción, todo desde la terminal.

Generación de audio multilingüe

Usa eleven_multilingual_v2 con --lang de|fr|es|... para generar TTS correctamente normalizado en idiomas distintos al inglés, ideal para flujos de trabajo de contenido localizado.

Requisitos

Clave de API de ElevenLabs (obligatoria) — Impulsa toda la generación de texto a voz. Configúrala como ELEVENLABS_API_KEY (recomendado) o SAG_API_KEY.
Voz predeterminada (opcional) — Configura ELEVENLABS_VOICE_ID o SAG_VOICE_ID para evitar especificar -v en cada llamada.

Conectando a tu agente...

npx clawhub@latest install sag

19Instalaciones actuales

603Instalaciones totales

v1.0.0Versión

Requisitos

ElevenLabs API KeyElevenLabs API Key (sag alias)(optional)Default Voice ID(optional)Default Voice ID (sag alias)(optional)

Ver código fuente(ClawHub)

Preguntas frecuentes

Reseñas

0 reseñas

Inicia sesión para escribir una reseña

Aún no hay reseñas. ¡Sé el primero en compartir tu experiencia!