Use vozes de IA do ElevenLabs pela linha de comando com uma interface `say` familiar no estilo mac e tags de áudio expressivas.
npx clawhub@latest install sagRequisitos
sag é uma ferramenta de CLI que traz a conversão de texto em fala da ElevenLabs para o seu terminal com uma UX inspirada no comando say nativo do macOS. Desenvolvida com os modelos mais recentes da ElevenLabs — incluindo o expressivo eleven_v3 — ela suporta reprodução de áudio local, múltiplas vozes, tags de emoção/entonação e controle refinado de pronúncia. Instale uma vez e gere áudio falado de alta qualidade a partir de qualquer texto, script ou resposta de agente de IA.
npx clawhub@latest install sagClique no botão Instalar no topo desta página para configuração com um clique
[whispers], [excited] ou [sarcastic].eleven_v3, eleven_multilingual_v2, eleven_flash_v2_5).say do macOS que use vozes premium do ElevenLabs em vez das vozes do sistema.<phoneme> em SSML; o Sag não expõe esse recurso.say é suficiente.Escolha entre eleven_v3 (expressivo, padrão), eleven_multilingual_v2 (estável, multilíngue) e eleven_flash_v2_5 (rápido) para equilibrar qualidade, velocidade e cobertura de idiomas em cada caso de uso.
Incorpore sinais de entrega diretamente no seu texto usando tags como [whispers], [shouts], [laughs], [excited], [sarcastic] e mais. O controle de pausa utiliza [pause], [short pause] e [long pause] em vez de SSML.
Especifique qualquer voz do ElevenLabs por nome ou ID com a flag -v, defina uma voz padrão via ELEVENLABS_VOICE_ID / SAG_VOICE_ID, e navegue pelas vozes disponíveis com sag voices.
Corrija erros de pronúncia reescrevendo palavras, usando hífens ou ajustando a capitalização. A flag --normalize auto|off lida com números, unidades e URLs, enquanto --lang orienta a normalização específica por idioma.
Execute sag prompting para obter orientações específicas do modelo sobre como formular e formatar texto para obter os melhores resultados com o modelo atualmente selecionado.
Salve o áudio gerado diretamente no disco com a flag -o (ex.: -o /tmp/reply.mp3), facilitando a anexação de arquivos de áudio às respostas de agentes de IA ou fluxos de trabalho subsequentes.
Um agente de IA gera uma resposta falada com um personagem específico — por exemplo, sag -v Clawd -o /tmp/reply.mp3 "[excited] Here's what I found!" — e então inclui o caminho do arquivo em sua resposta para reprodução imediata.
Alimente texto ou conteúdo de documentos para o sag em um script de shell para produzir arquivos de áudio narrados em massa, utilizando --normalize auto para tratar números e URLs de forma limpa.
Audicie rapidamente diferentes vozes e estilos de entrega do ElevenLabs ([whispers], [sarcastic], [sings]) antes de se comprometer com uma narração de produção, tudo pelo terminal.
Use eleven_multilingual_v2 com --lang de|fr|es|... para gerar TTS corretamente normalizado em idiomas diferentes do inglês, adequado para pipelines de conteúdo localizado.
ELEVENLABS_API_KEY (preferido) ou SAG_API_KEY.ELEVENLABS_VOICE_ID ou SAG_VOICE_ID para evitar especificar -v em cada chamada.npx clawhub@latest install sagRequisitos
Faça login para escrever uma avaliação
Nenhuma avaliação ainda. Seja o primeiro a compartilhar sua experiência!