openai-whisper-api

Name: openai-whisper-api
Author: OpenClaw

Destaque

Transcreva arquivos de áudio para texto usando a API Whisper da OpenAI — suporta múltiplos formatos, idiomas e opções de saída por meio de uma CLI simples.

por OpenClawv1.0.0

Conectando ao seu agente...

npx clawhub@latest install openai-whisper-api

239Instalações atuais

v1.0.0Versão

Requisitos

curlOpenAI API Key

Visão geral do skill openai-whisper-api

openai-whisper-api é uma skill que encapsula o endpoint /v1/audio/transcriptions da OpenAI (Whisper) em um script shell direto ao ponto. Aponte para qualquer arquivo de áudio e obtenha uma transcrição em texto simples em segundos. Ela suporta seleção de modelo, dicas de idioma, caminhos de saída personalizados e saída em JSON — tudo por meio de flags de linha de comando.

Como usar

Step 1: Execute no terminal ou instale este skill no AgentCellar

npx clawhub@latest install openai-whisper-api

Clique no botão Instalar no topo desta página para configuração com um clique

When to Use openai-whisper-api

Best Fit

Você tem arquivos de áudio (por exemplo, .m4a, .ogg) que precisam ser transcritos rapidamente sem precisar criar um código de integração de API personalizado.
Você quer automatizar a transcrição como parte de um pipeline de shell ou fluxo de trabalho com scripts.
Você precisa passar uma dica de idioma ou um prompt com o nome do locutor para melhorar a precisão da transcrição.
Você quer uma saída JSON estruturada da API do Whisper em vez de texto simples.

When Not to Use

Você precisa de transcrição em tempo real ou streaming — esta skill envia arquivos de áudio completos para a API e não é adequada para áudio ao vivo.
Você não se sente confortável em definir uma OPENAI_API_KEY, pois a skill não possui um backend de transcrição alternativo.

Principais funcionalidades

Transcrição simples com um único comando

Execute um único script shell com o caminho para o seu arquivo de áudio e receba uma transcrição em .txt ao lado dele por padrão. Nenhum código boilerplate de API necessário.

Opções flexíveis de saída

Escreva a saída em um caminho personalizado com --out, ou solicite JSON bruto da API com --json para processamento posterior.

Dicas de idioma e prompt

Use --language para especificar o idioma falado (por exemplo, en) para maior precisão, ou --prompt para fornecer contexto como nomes de falantes que ajudam a orientar a transcrição.

Seleção de modelo

O padrão é whisper-1, mas aceita a flag --model, mantendo você preparado para futuras variantes do modelo Whisper oferecidas pela OpenAI.

Casos de uso

Transcrição de reunião ou entrevista

Grave uma reunião ou entrevista e, em seguida, execute a skill no arquivo de áudio para produzir uma transcrição completa em texto. Passe --prompt com os nomes dos participantes para melhorar o reconhecimento de nomes de falantes na saída.

Pipeline de transcrição automatizada

Integre o script em um cron job ou fluxo de CI que capture novos arquivos de áudio de um diretório e os transcreva automaticamente, gravando os resultados em uma pasta de saída especificada.

Arquivamento de podcasts ou notas de voz

Converta uma biblioteca de memos de voz ou episódios de podcast em arquivos de texto pesquisáveis, automatizando a skill openai-whisper-api sobre um lote de arquivos de áudio.

Requisitos

OpenAI API Key (obrigatória) — Autentica as requisições para /v1/audio/transcriptions. Defina por meio da variável de ambiente OPENAI_API_KEY ou em ~/.openclaw/openclaw.json.

Conectando ao seu agente...

npx clawhub@latest install openai-whisper-api

239Instalações atuais

v1.0.0Versão

Requisitos

curlOpenAI API Key

Perguntas frequentes

Avaliações

0 avaliações

Faça login para escrever uma avaliação

Nenhuma avaliação ainda. Seja o primeiro a compartilhar sua experiência!