Usa le voci AI di ElevenLabs dalla riga di comando con una familiare interfaccia `say` in stile Mac e tag audio espressivi.
npx clawhub@latest install sagRequisiti
sag è uno strumento CLI che porta la sintesi vocale di ElevenLabs nel tuo terminale con un'esperienza utente ispirata al comando integrato say di macOS. Alimentato dagli ultimi modelli di ElevenLabs — incluso l'espressivo eleven_v3 — supporta la riproduzione audio locale, voci multiple, tag per emozioni/stile di recitazione e un controllo preciso della pronuncia. Installalo una volta sola e genera audio parlato di alta qualità da qualsiasi testo, script o risposta di un agente AI.
npx clawhub@latest install sagFai clic sul pulsante Installa in cima a questa pagina per la configurazione con un clic
[whispers], [excited] o [sarcastic].eleven_v3, eleven_multilingual_v2, eleven_flash_v2_5).say di macOS che utilizzi voci ElevenLabs premium al posto delle voci di sistema.<phoneme>; sag non espone questa funzionalità.say è sufficiente.Scegli tra eleven_v3 (espressivo, predefinito), eleven_multilingual_v2 (stabile, multilingue) e eleven_flash_v2_5 (veloce) per bilanciare qualità, velocità e copertura linguistica in base a ogni caso d'uso.
Incorpora i segnali di consegna direttamente nel tuo testo usando tag come [whispers], [shouts], [laughs], [excited], [sarcastic] e altri. Il controllo delle pause utilizza [pause], [short pause] e [long pause] al posto dell'SSML.
Specifica qualsiasi voce di ElevenLabs tramite nome o ID con il flag -v, imposta una voce predefinita tramite ELEVENLABS_VOICE_ID / SAG_VOICE_ID, e sfoglia le voci disponibili con sag voices.
Correggi le pronunce errate riscrivendo le parole, usando i trattini o modificando le maiuscole. Il flag --normalize auto|off gestisce numeri, unità di misura e URL, mentre --lang guida la normalizzazione specifica per lingua.
Esegui sag prompting per ottenere indicazioni specifiche per modello su come formulare e formattare il testo per ottenere i migliori risultati con il modello attualmente selezionato.
Salva l'audio generato direttamente su disco con il flag -o (ad es., -o /tmp/reply.mp3), rendendo semplice allegare file audio alle risposte degli agenti AI o ai flussi di lavoro successivi.
Un agente AI genera una risposta parlata con un carattere specifico — ad esempio, sag -v Clawd -o /tmp/reply.mp3 "[excited] Here's what I found!" — quindi include il percorso del file nella sua risposta per la riproduzione immediata.
Fornisci testo o contenuto di documenti a sag in uno script shell per produrre in blocco file audio narrati, sfruttando --normalize auto per gestire numeri e URL in modo pulito.
Testa rapidamente diverse voci di ElevenLabs e stili di consegna ([whispers], [sarcastic], [sings]) prima di impegnarti in una voce fuori campo per la produzione, il tutto direttamente dal terminale.
Usa eleven_multilingual_v2 con --lang de|fr|es|... per generare TTS correttamente normalizzato in lingue diverse dall'inglese, adatto per pipeline di contenuti localizzati.
ELEVENLABS_API_KEY (preferito) o SAG_API_KEY.ELEVENLABS_VOICE_ID o SAG_VOICE_ID per evitare di specificare -v ad ogni chiamata.npx clawhub@latest install sagRequisiti
Accedi per scrivere una recensione
Nessuna recensione ancora. Sii il primo a condividere la tua esperienza!