Nutze ElevenLabs KI-Stimmen über die Befehlszeile mit einer vertrauten Mac-ähnlichen `say`-Oberfläche und ausdrucksstarken Audio-Tags.
npx clawhub@latest install sagVoraussetzungen
sag ist ein CLI-Tool, das ElevenLabs-Text-to-Speech in Ihr Terminal bringt – mit einer UX, die vom integrierten say-Befehl von macOS inspiriert ist. Angetrieben von ElevenLabs' neuesten Modellen – einschließlich des ausdrucksstarken eleven_v3 – unterstützt es lokale Audiowiedergabe, mehrere Stimmen, Emotions-/Ausdrucks-Tags und eine präzise Aussprachesteuerung. Einmal installiert, können Sie hochwertige Sprachausgaben aus beliebigem Text, Skripten oder KI-Agenten-Antworten generieren.
npx clawhub@latest install sagKlicke oben auf der Seite auf Installieren für die Ein-Klick-Einrichtung
[whispers], [excited] oder [sarcastic].eleven_v3, eleven_multilingual_v2, eleven_flash_v2_5).say, der Premium-ElevenLabs-Stimmen anstelle von Systemstimmen verwendet.<phoneme>-Unterstützung; Sag stellt diese Funktion nicht bereit.say-Befehl ist ausreichend.Wählen Sie zwischen eleven_v3 (ausdrucksstark, Standard), eleven_multilingual_v2 (stabil, mehrsprachig) und eleven_flash_v2_5 (schnell), um Qualität, Geschwindigkeit und Sprachabdeckung für jeden Anwendungsfall optimal abzustimmen.
Bette Lieferhinweise direkt in deinen Text ein, indem du Tags wie [whispers], [shouts], [laughs], [excited], [sarcastic] und weitere verwendest. Die Pausensteuerung nutzt [pause], [short pause] und [long pause] anstelle von SSML.
Gib eine beliebige ElevenLabs-Stimme per Name oder ID mit dem -v-Flag an, lege eine Standardstimme über ELEVENLABS_VOICE_ID / SAG_VOICE_ID fest und durchsuche verfügbare Stimmen mit sag voices.
Behebe Ausspracheprobleme, indem du Wörter neu buchstabierst, Bindestriche verwendest oder die Groß- und Kleinschreibung anpasst. Das Flag --normalize auto|off verarbeitet Zahlen, Einheiten und URLs, während --lang die sprachspezifische Normalisierung steuert.
Führe sag prompting aus, um modellspezifische Anleitungen zu erhalten, wie du Text am besten formulierst und formatierst, um optimale Ergebnisse mit dem aktuell ausgewählten Modell zu erzielen.
Speichere generiertes Audio direkt auf der Festplatte mit dem -o-Flag (z. B. -o /tmp/reply.mp3), um Audiodateien einfach an KI-Agenten-Antworten oder nachgelagerte Workflows anzuhängen.
Ein KI-Agent generiert eine gesprochene Antwort mit einem bestimmten Charakter – z. B. sag -v Clawd -o /tmp/reply.mp3 "[excited] Here's what I found!" – und fügt dann den Dateipfad in seine Antwort ein, um die sofortige Wiedergabe zu ermöglichen.
Übergib Text oder Dokumentinhalte in einem Shell-Skript an sag, um in großen Mengen vertonte Audiodateien zu erstellen, und nutze --normalize auto, um Zahlen und URLs sauber zu verarbeiten.
Probiere schnell verschiedene ElevenLabs-Stimmen und Sprechstile ([whispers], [sarcastic], [sings]) aus, bevor du dich für einen Produktions-Voice-over entscheidest – alles direkt vom Terminal aus.
Verwende eleven_multilingual_v2 mit --lang de|fr|es|..., um korrekt normalisiertes TTS in anderen Sprachen als Englisch zu generieren, geeignet für lokalisierte Content-Pipelines.
ELEVENLABS_API_KEY (empfohlen) oder SAG_API_KEY festlegen.ELEVENLABS_VOICE_ID oder SAG_VOICE_ID festlegen, um die Angabe von -v bei jedem Aufruf zu vermeiden.npx clawhub@latest install sagVoraussetzungen
Anmelden, um eine Bewertung zu schreiben
Noch keine Bewertungen. Sei der Erste, der seine Erfahrungen teilt!