Transcribe archivos de audio a texto usando la API Whisper de OpenAI — admite múltiples formatos, idiomas y opciones de salida a través de una CLI simple.
npx clawhub@latest install openai-whisper-apiRequisitos
openai-whisper-api es una habilidad que envuelve el endpoint /v1/audio/transcriptions de OpenAI (Whisper) en un script de shell sencillo. Apúntalo a cualquier archivo de audio y obtén una transcripción en texto plano en cuestión de segundos. Admite selección de modelo, sugerencias de idioma, rutas de salida personalizadas y salida en JSON, todo mediante flags de línea de comandos.
npx clawhub@latest install openai-whisper-apiHaz clic en el botón Instalar en la parte superior de esta página para una configuración rápida
.m4a, .ogg) que necesitas transcribir rápidamente sin tener que escribir código de integración de API personalizado.OPENAI_API_KEY, ya que la skill no tiene un backend de transcripción alternativo.Ejecuta un único script de shell con la ruta a tu archivo de audio y recibe de forma predeterminada un transcript en .txt junto a él. No se requiere código repetitivo de API.
Escribe la salida en una ruta personalizada con --out, o solicita JSON sin procesar desde la API con --json para su procesamiento posterior.
Usa --language para especificar el idioma hablado (por ejemplo, en) y mejorar la precisión, o --prompt para proporcionar contexto como nombres de hablantes que ayuden a orientar la transcripción.
El valor predeterminado es whisper-1, pero acepta un indicador --model, manteniéndote preparado para futuras variantes del modelo Whisper ofrecidas por OpenAI.
Graba una reunión o entrevista y luego ejecuta la habilidad sobre el archivo de audio para obtener una transcripción completa en texto. Usa --prompt con los nombres de los participantes para mejorar el reconocimiento de nombres de hablantes en el resultado.
Integra el script en un cron job o flujo de trabajo de CI que recoja nuevos archivos de audio de un directorio y los transcriba automáticamente con openai-whisper-api, escribiendo los resultados en una carpeta de salida especificada.
Convierte una biblioteca de memos de voz o episodios de podcast en archivos de texto con capacidad de búsqueda mediante la automatización de la skill openai-whisper-api sobre un lote de archivos de audio.
/v1/audio/transcriptions. Se establece mediante la variable de entorno OPENAI_API_KEY o en ~/.openclaw/openclaw.json.npx clawhub@latest install openai-whisper-apiRequisitos
Inicia sesión para escribir una reseña
Aún no hay reseñas. ¡Sé el primero en compartir tu experiencia!