Utilisez les voix IA ElevenLabs depuis la ligne de commande avec une interface `say` familière de style mac et des balises audio expressives.
npx clawhub@latest install sagPrérequis
Sag est un outil CLI qui intègre la synthèse vocale ElevenLabs dans votre terminal, avec une expérience utilisateur inspirée de la commande say native de macOS. Propulsé par les derniers modèles d'ElevenLabs — dont l'expressif eleven_v3 — il prend en charge la lecture audio locale, plusieurs voix, des balises d'émotion et de rendu, ainsi qu'un contrôle précis de la prononciation. Installez-le une seule fois et générez un audio parlé de haute qualité à partir de n'importe quel texte, script ou réponse d'agent IA.
npx clawhub@latest install sagCliquez sur le bouton Installer en haut de cette page pour une configuration en un clic
[whispers], [excited], ou [sarcastic].eleven_v3, eleven_multilingual_v2, eleven_flash_v2_5).say qui utilise des voix ElevenLabs premium à la place des voix système.<phoneme> ; sag n'expose pas cette fonctionnalité.say est suffisante.Choisissez entre eleven_v3 (expressif, par défaut), eleven_multilingual_v2 (stable, multilingue) et eleven_flash_v2_5 (rapide) pour équilibrer qualité, vitesse et couverture linguistique selon chaque cas d'usage.
Intégrez des indices de rendu directement dans votre texte à l'aide de balises telles que [whispers], [shouts], [laughs], [excited], [sarcastic], et bien d'autres. Le contrôle des pauses utilise [pause], [short pause] et [long pause] plutôt que le SSML.
Spécifiez n'importe quelle voix ElevenLabs par nom ou par ID avec le drapeau -v, définissez une voix par défaut via ELEVENLABS_VOICE_ID / SAG_VOICE_ID, et parcourez les voix disponibles avec sag voices.
Corrigez les erreurs de prononciation en réécrivant les mots, en utilisant des traits d'union ou en ajustant la casse. Le drapeau --normalize auto|off gère les nombres, les unités et les URL, tandis que --lang guide la normalisation spécifique à la langue.
Exécutez sag prompting pour obtenir des conseils spécifiques au modèle sur la façon de formuler et de mettre en forme le texte afin d'obtenir les meilleurs résultats avec le modèle actuellement sélectionné.
Enregistrez l'audio généré directement sur le disque avec l'option -o (par exemple, -o /tmp/reply.mp3), ce qui facilite l'ajout de fichiers audio aux réponses des agents IA ou aux flux de travail en aval.
Un agent IA génère une réponse parlée avec un caractère spécifique — par exemple, sag -v Clawd -o /tmp/reply.mp3 "[excited] Here's what I found!" — puis inclut le chemin du fichier dans sa réponse pour une lecture immédiate.
Transmettez du texte ou du contenu de document à sag dans un script shell pour produire des fichiers audio narrés en masse, en exploitant --normalize auto pour traiter proprement les nombres et les URL.
Auditionner rapidement différentes voix ElevenLabs et styles de rendu ([whispers], [sarcastic], [sings]) avant de valider une voix pour la production, le tout depuis le terminal.
Utilisez eleven_multilingual_v2 avec --lang de|fr|es|... pour générer une synthèse vocale correctement normalisée dans des langues autres que l'anglais, adaptée aux pipelines de contenu localisé.
ELEVENLABS_API_KEY (recommandé) ou SAG_API_KEY.ELEVENLABS_VOICE_ID ou SAG_VOICE_ID pour éviter de spécifier -v à chaque appel.npx clawhub@latest install sagPrérequis
Se connecter pour écrire un avis
Aucun avis pour l'instant. Soyez le premier à partager votre expérience !