Sag

Name: Sag
Author: Peter Steinberger

Utilisez les voix IA ElevenLabs depuis la ligne de commande avec une interface `say` familière de style mac et des balises audio expressives.

Peter Steinbergerv1.0.0

Connexion à votre agent...

npx clawhub@latest install sag

19Installations actuelles

603Installations totales

v1.0.0Version

Prérequis

ElevenLabs API KeyElevenLabs API Key (sag alias)(optional)Default Voice ID(optional)Default Voice ID (sag alias)(optional)

Voir le code source(ClawHub)

Aperçu du skill Sag

Sag est un outil CLI qui intègre la synthèse vocale ElevenLabs dans votre terminal, avec une expérience utilisateur inspirée de la commande say native de macOS. Propulsé par les derniers modèles d'ElevenLabs — dont l'expressif eleven_v3 — il prend en charge la lecture audio locale, plusieurs voix, des balises d'émotion et de rendu, ainsi qu'un contrôle précis de la prononciation. Installez-le une seule fois et générez un audio parlé de haute qualité à partir de n'importe quel texte, script ou réponse d'agent IA.

Comment l’utiliser

Step 1: Exécutez dans votre terminal ou installez ce skill sur AgentCellar

npx clawhub@latest install sag

Cliquez sur le bouton Installer en haut de cette page pour une configuration en un clic

When to Use Sag

Best Fit

Vous souhaitez générer de l'audio vocal IA expressif et de haute qualité depuis la ligne de commande sans écrire de code API personnalisé.
Vous avez besoin d'un agent IA (comme Clawd) pour produire des réponses vocales parlées avec du caractère et de l'émotion, en utilisant des balises comme [whispers], [excited], ou [sarcastic].
Vous créez des scripts de workflows TTS nécessitant la sélection de voix, la normalisation de la langue ou le changement de modèle (eleven_v3, eleven_multilingual_v2, eleven_flash_v2_5).
Vous voulez un remplacement direct pour la commande macOS say qui utilise des voix ElevenLabs premium à la place des voix système.

When Not to Use

Vous n'avez pas de clé API ElevenLabs ou ne souhaitez pas engager de coûts d'utilisation ElevenLabs — cette compétence ne dispose d'aucune solution de repli gratuite/hors ligne.
Vous avez besoin de la prise en charge SSML <phoneme> ; sag n'expose pas cette fonctionnalité.
Vous avez uniquement besoin d'une synthèse vocale basique au niveau système sur macOS et n'avez pas besoin de la qualité ElevenLabs — la commande intégrée say est suffisante.

Fonctionnalités clés

Plusieurs modèles ElevenLabs

Choisissez entre eleven_v3 (expressif, par défaut), eleven_multilingual_v2 (stable, multilingue) et eleven_flash_v2_5 (rapide) pour équilibrer qualité, vitesse et couverture linguistique selon chaque cas d'usage.

Balises audio expressives (v3)

Intégrez des indices de rendu directement dans votre texte à l'aide de balises telles que [whispers], [shouts], [laughs], [excited], [sarcastic], et bien d'autres. Le contrôle des pauses utilise [pause], [short pause] et [long pause] plutôt que le SSML.

Sélection et liste des voix

Spécifiez n'importe quelle voix ElevenLabs par nom ou par ID avec le drapeau -v, définissez une voix par défaut via ELEVENLABS_VOICE_ID / SAG_VOICE_ID, et parcourez les voix disponibles avec sag voices.

Contrôles de prononciation et de normalisation

Corrigez les erreurs de prononciation en réécrivant les mots, en utilisant des traits d'union ou en ajustant la casse. Le drapeau --normalize auto|off gère les nombres, les unités et les URL, tandis que --lang guide la normalisation spécifique à la langue.

Conseils de formulation spécifiques au modèle

Exécutez sag prompting pour obtenir des conseils spécifiques au modèle sur la façon de formuler et de mettre en forme le texte afin d'obtenir les meilleurs résultats avec le modèle actuellement sélectionné.

Sortie vers un fichier

Enregistrez l'audio généré directement sur le disque avec l'option -o (par exemple, -o /tmp/reply.mp3), ce qui facilite l'ajout de fichiers audio aux réponses des agents IA ou aux flux de travail en aval.

Cas d'utilisation

Réponses vocales d'un agent IA

Un agent IA génère une réponse parlée avec un caractère spécifique — par exemple, sag -v Clawd -o /tmp/reply.mp3 "[excited] Here's what I found!" — puis inclut le chemin du fichier dans sa réponse pour une lecture immédiate.

Narration TTS scriptée

Transmettez du texte ou du contenu de document à sag dans un script shell pour produire des fichiers audio narrés en masse, en exploitant --normalize auto pour traiter proprement les nombres et les URL.

Prototypage vocal pour créateurs de contenu

Auditionner rapidement différentes voix ElevenLabs et styles de rendu ([whispers], [sarcastic], [sings]) avant de valider une voix pour la production, le tout depuis le terminal.

Génération audio multilingue

Utilisez eleven_multilingual_v2 avec --lang de|fr|es|... pour générer une synthèse vocale correctement normalisée dans des langues autres que l'anglais, adaptée aux pipelines de contenu localisé.

Prérequis

Clé API ElevenLabs (obligatoire) — Alimente toute la génération de texte en parole. À définir comme ELEVENLABS_API_KEY (recommandé) ou SAG_API_KEY.
Voix par défaut (facultatif) — Définissez ELEVENLABS_VOICE_ID ou SAG_VOICE_ID pour éviter de spécifier -v à chaque appel.

Connexion à votre agent...

npx clawhub@latest install sag

19Installations actuelles

603Installations totales

v1.0.0Version

Prérequis

ElevenLabs API KeyElevenLabs API Key (sag alias)(optional)Default Voice ID(optional)Default Voice ID (sag alias)(optional)

Voir le code source(ClawHub)

FAQ

Avis

0 avis

Se connecter pour écrire un avis

Aucun avis pour l'instant. Soyez le premier à partager votre expérience !