Usa voces de IA de ElevenLabs desde la línea de comandos con una interfaz `say` al estilo Mac familiar y etiquetas de audio expresivas.
npx clawhub@latest install sagRequisitos
Sag es una herramienta de CLI que lleva la síntesis de voz de ElevenLabs a tu terminal con una experiencia de usuario inspirada en el comando say integrado en macOS. Impulsada por los últimos modelos de ElevenLabs — incluyendo el expresivo eleven_v3 — admite reproducción de audio local, múltiples voces, etiquetas de emoción/entonación y control detallado de pronunciación. Instálala una vez y genera audio hablado de alta calidad a partir de cualquier texto, script o respuesta de un agente de IA.
npx clawhub@latest install sagHaz clic en el botón Instalar en la parte superior de esta página para una configuración rápida
[whispers], [excited] o [sarcastic].eleven_v3, eleven_multilingual_v2, eleven_flash_v2_5).say de macOS que utilice voces premium de ElevenLabs en lugar de las voces del sistema.<phoneme> de SSML; Sag no expone esa función.say es suficiente.Elige entre eleven_v3 (expresivo, predeterminado), eleven_multilingual_v2 (estable, multilingüe) y eleven_flash_v2_5 (rápido) para equilibrar calidad, velocidad y cobertura de idiomas en cada caso de uso.
Incorpora señales de entrega directamente en tu texto usando etiquetas como [whispers], [shouts], [laughs], [excited], [sarcastic] y más. El control de pausas utiliza [pause], [short pause] y [long pause] en lugar de SSML.
Especifica cualquier voz de ElevenLabs por nombre o ID con la bandera -v, establece una predeterminada mediante ELEVENLABS_VOICE_ID / SAG_VOICE_ID, y explora las voces disponibles con sag voices.
Corrige errores de pronunciación deletreando palabras de nuevo, usando guiones o ajustando el uso de mayúsculas. El indicador --normalize auto|off maneja números, unidades y URLs, mientras que --lang orienta la normalización específica del idioma.
Ejecuta sag prompting para obtener orientación específica del modelo sobre cómo formular y formatear el texto para obtener los mejores resultados con el modelo seleccionado actualmente.
Guarda el audio generado directamente en el disco con la marca -o (por ejemplo, -o /tmp/reply.mp3), facilitando la incorporación de archivos de audio en respuestas de agentes de IA o flujos de trabajo posteriores.
Un agente de IA genera una respuesta hablada con un carácter específico — por ejemplo, sag -v Clawd -o /tmp/reply.mp3 "[excited] Here's what I found!" — y luego incluye la ruta del archivo en su respuesta para reproducción inmediata.
Proporciona texto o contenido de documentos a sag en un script de shell para producir archivos de audio narrados en masa, aprovechando --normalize auto para manejar números y URLs de forma limpia.
Audita rápidamente diferentes voces y estilos de entrega de ElevenLabs ([whispers], [sarcastic], [sings]) antes de comprometerte con una locución de producción, todo desde la terminal.
Usa eleven_multilingual_v2 con --lang de|fr|es|... para generar TTS correctamente normalizado en idiomas distintos al inglés, ideal para flujos de trabajo de contenido localizado.
ELEVENLABS_API_KEY (recomendado) o SAG_API_KEY.ELEVENLABS_VOICE_ID o SAG_VOICE_ID para evitar especificar -v en cada llamada.npx clawhub@latest install sagRequisitos
Inicia sesión para escribir una reseña
Aún no hay reseñas. ¡Sé el primero en compartir tu experiencia!