Transcreva arquivos de áudio para texto usando a API Whisper da OpenAI — suporta múltiplos formatos, idiomas e opções de saída por meio de uma CLI simples.
npx clawhub@latest install openai-whisper-apiRequisitos
openai-whisper-api é uma skill que encapsula o endpoint /v1/audio/transcriptions da OpenAI (Whisper) em um script shell direto ao ponto. Aponte para qualquer arquivo de áudio e obtenha uma transcrição em texto simples em segundos. Ela suporta seleção de modelo, dicas de idioma, caminhos de saída personalizados e saída em JSON — tudo por meio de flags de linha de comando.
npx clawhub@latest install openai-whisper-apiClique no botão Instalar no topo desta página para configuração com um clique
.m4a, .ogg) que precisam ser transcritos rapidamente sem precisar criar um código de integração de API personalizado.OPENAI_API_KEY, pois a skill não possui um backend de transcrição alternativo.Execute um único script shell com o caminho para o seu arquivo de áudio e receba uma transcrição em .txt ao lado dele por padrão. Nenhum código boilerplate de API necessário.
Escreva a saída em um caminho personalizado com --out, ou solicite JSON bruto da API com --json para processamento posterior.
Use --language para especificar o idioma falado (por exemplo, en) para maior precisão, ou --prompt para fornecer contexto como nomes de falantes que ajudam a orientar a transcrição.
O padrão é whisper-1, mas aceita a flag --model, mantendo você preparado para futuras variantes do modelo Whisper oferecidas pela OpenAI.
Grave uma reunião ou entrevista e, em seguida, execute a skill no arquivo de áudio para produzir uma transcrição completa em texto. Passe --prompt com os nomes dos participantes para melhorar o reconhecimento de nomes de falantes na saída.
Integre o script em um cron job ou fluxo de CI que capture novos arquivos de áudio de um diretório e os transcreva automaticamente, gravando os resultados em uma pasta de saída especificada.
Converta uma biblioteca de memos de voz ou episódios de podcast em arquivos de texto pesquisáveis, automatizando a skill openai-whisper-api sobre um lote de arquivos de áudio.
/v1/audio/transcriptions. Defina por meio da variável de ambiente OPENAI_API_KEY ou em ~/.openclaw/openclaw.json.npx clawhub@latest install openai-whisper-apiRequisitos
Faça login para escrever uma avaliação
Nenhuma avaliação ainda. Seja o primeiro a compartilhar sua experiência!