Sag

Name: Sag
Author: Peter Steinberger

Nutze ElevenLabs KI-Stimmen über die Befehlszeile mit einer vertrauten Mac-ähnlichen `say`-Oberfläche und ausdrucksstarken Audio-Tags.

Peter Steinbergerv1.0.0

Verbindung zum Agenten wird hergestellt...

npx clawhub@latest install sag

19Aktuelle Installationen

603Gesamte Installationen

v1.0.0Version

Voraussetzungen

ElevenLabs API KeyElevenLabs API Key (sag alias)(optional)Default Voice ID(optional)Default Voice ID (sag alias)(optional)

Quellcode ansehen(ClawHub)

Sag Skill-Übersicht

sag ist ein CLI-Tool, das ElevenLabs-Text-to-Speech in Ihr Terminal bringt – mit einer UX, die vom integrierten say-Befehl von macOS inspiriert ist. Angetrieben von ElevenLabs' neuesten Modellen – einschließlich des ausdrucksstarken eleven_v3 – unterstützt es lokale Audiowiedergabe, mehrere Stimmen, Emotions-/Ausdrucks-Tags und eine präzise Aussprachesteuerung. Einmal installiert, können Sie hochwertige Sprachausgaben aus beliebigem Text, Skripten oder KI-Agenten-Antworten generieren.

So verwenden Sie es

Step 1: Im Terminal ausführen oder auf AgentCellar installieren

npx clawhub@latest install sag

oder

Klicke oben auf der Seite auf Installieren für die Ein-Klick-Einrichtung

When to Use Sag

Best Fit

Du möchtest ausdrucksstarke, hochwertige KI-Sprachaudio über die Befehlszeile generieren, ohne benutzerdefinierten API-Code schreiben zu müssen.
Du benötigst einen KI-Agenten (wie Clawd), der gesprochene Sprachantworten mit Charakter und Emotion erzeugt, mithilfe von Tags wie [whispers], [excited] oder [sarcastic].
Du skriptest TTS-Workflows, die Stimmauswahl, Sprachnormalisierung oder Modellwechsel erfordern (eleven_v3, eleven_multilingual_v2, eleven_flash_v2_5).
Du möchtest einen direkten Ersatz für macOS say, der Premium-ElevenLabs-Stimmen anstelle von Systemstimmen verwendet.

When Not to Use

Du hast keinen ElevenLabs-API-Schlüssel oder möchtest keine ElevenLabs-Nutzungskosten verursachen – diese Skill bietet keinen kostenlosen/Offline-Fallback.
Du benötigst SSML-<phoneme>-Unterstützung; Sag stellt diese Funktion nicht bereit.
Du benötigst nur einfache TTS auf Systemebene unter macOS und brauchst keine ElevenLabs-Qualität – der integrierte say-Befehl ist ausreichend.

Hauptfunktionen

Mehrere ElevenLabs-Modelle

Wählen Sie zwischen eleven_v3 (ausdrucksstark, Standard), eleven_multilingual_v2 (stabil, mehrsprachig) und eleven_flash_v2_5 (schnell), um Qualität, Geschwindigkeit und Sprachabdeckung für jeden Anwendungsfall optimal abzustimmen.

Ausdrucksstarke Audio-Tags (v3)

Bette Lieferhinweise direkt in deinen Text ein, indem du Tags wie [whispers], [shouts], [laughs], [excited], [sarcastic] und weitere verwendest. Die Pausensteuerung nutzt [pause], [short pause] und [long pause] anstelle von SSML.

Stimmauswahl & Auflistung

Gib eine beliebige ElevenLabs-Stimme per Name oder ID mit dem -v-Flag an, lege eine Standardstimme über ELEVENLABS_VOICE_ID / SAG_VOICE_ID fest und durchsuche verfügbare Stimmen mit sag voices.

Aussprache- und Normalisierungssteuerung

Behebe Ausspracheprobleme, indem du Wörter neu buchstabierst, Bindestriche verwendest oder die Groß- und Kleinschreibung anpasst. Das Flag --normalize auto|off verarbeitet Zahlen, Einheiten und URLs, während --lang die sprachspezifische Normalisierung steuert.

Modellspezifische Prompting-Tipps

Führe sag prompting aus, um modellspezifische Anleitungen zu erhalten, wie du Text am besten formulierst und formatierst, um optimale Ergebnisse mit dem aktuell ausgewählten Modell zu erzielen.

Ausgabe in Datei

Speichere generiertes Audio direkt auf der Festplatte mit dem -o-Flag (z. B. -o /tmp/reply.mp3), um Audiodateien einfach an KI-Agenten-Antworten oder nachgelagerte Workflows anzuhängen.

Anwendungsfälle

KI-Agent-Sprachantworten

Ein KI-Agent generiert eine gesprochene Antwort mit einem bestimmten Charakter – z. B. sag -v Clawd -o /tmp/reply.mp3 "[excited] Here's what I found!" – und fügt dann den Dateipfad in seine Antwort ein, um die sofortige Wiedergabe zu ermöglichen.

Geskriptete TTS-Narration

Übergib Text oder Dokumentinhalte in einem Shell-Skript an sag, um in großen Mengen vertonte Audiodateien zu erstellen, und nutze --normalize auto, um Zahlen und URLs sauber zu verarbeiten.

Sprachprototyping für Content-Ersteller

Probiere schnell verschiedene ElevenLabs-Stimmen und Sprechstile ([whispers], [sarcastic], [sings]) aus, bevor du dich für einen Produktions-Voice-over entscheidest – alles direkt vom Terminal aus.

Mehrsprachige Audiogenerierung

Verwende eleven_multilingual_v2 mit --lang de|fr|es|..., um korrekt normalisiertes TTS in anderen Sprachen als Englisch zu generieren, geeignet für lokalisierte Content-Pipelines.

Voraussetzungen

ElevenLabs API Key (erforderlich) — Ermöglicht die gesamte Text-zu-Sprache-Generierung. Als ELEVENLABS_API_KEY (empfohlen) oder SAG_API_KEY festlegen.
Standardstimme (optional) — ELEVENLABS_VOICE_ID oder SAG_VOICE_ID festlegen, um die Angabe von -v bei jedem Aufruf zu vermeiden.

Verbindung zum Agenten wird hergestellt...

npx clawhub@latest install sag

19Aktuelle Installationen

603Gesamte Installationen

v1.0.0Version

Voraussetzungen

ElevenLabs API KeyElevenLabs API Key (sag alias)(optional)Default Voice ID(optional)Default Voice ID (sag alias)(optional)

Quellcode ansehen(ClawHub)

FAQ

Bewertungen

0 Bewertungen

Anmelden, um eine Bewertung zu schreiben

Noch keine Bewertungen. Sei der Erste, der seine Erfahrungen teilt!