openai-whisper-api

Name: openai-whisper-api
Author: OpenClaw

Destacado

Transcribe archivos de audio a texto usando la API Whisper de OpenAI — admite múltiples formatos, idiomas y opciones de salida a través de una CLI simple.

por OpenClawv1.0.0

Conectando a tu agente...

npx clawhub@latest install openai-whisper-api

239Instalaciones actuales

v1.0.0Versión

Requisitos

curlOpenAI API Key

Descripción del skill openai-whisper-api

openai-whisper-api es una habilidad que envuelve el endpoint /v1/audio/transcriptions de OpenAI (Whisper) en un script de shell sencillo. Apúntalo a cualquier archivo de audio y obtén una transcripción en texto plano en cuestión de segundos. Admite selección de modelo, sugerencias de idioma, rutas de salida personalizadas y salida en JSON, todo mediante flags de línea de comandos.

Cómo usarlo

Step 1: Ejecuta en tu terminal o instala este skill en AgentCellar

npx clawhub@latest install openai-whisper-api

Haz clic en el botón Instalar en la parte superior de esta página para una configuración rápida

When to Use openai-whisper-api

Best Fit

Tienes archivos de audio (p. ej., .m4a, .ogg) que necesitas transcribir rápidamente sin tener que escribir código de integración de API personalizado.
Quieres automatizar la transcripción como parte de un pipeline de shell o un flujo de trabajo con scripts.
Necesitas pasar una sugerencia de idioma o un prompt con el nombre del hablante para mejorar la precisión de la transcripción.
Quieres obtener una salida JSON estructurada de la API de Whisper en lugar de texto plano.

When Not to Use

Necesitas transcripción en tiempo real o en streaming — esta skill envía archivos de audio completos a la API y no es adecuada para audio en directo.
No te resulta cómodo configurar una OPENAI_API_KEY, ya que la skill no tiene un backend de transcripción alternativo.

Características principales

Transcripción simple con un solo comando

Ejecuta un único script de shell con la ruta a tu archivo de audio y recibe de forma predeterminada un transcript en .txt junto a él. No se requiere código repetitivo de API.

Opciones de salida flexibles

Escribe la salida en una ruta personalizada con --out, o solicita JSON sin procesar desde la API con --json para su procesamiento posterior.

Sugerencias de idioma y prompt

Usa --language para especificar el idioma hablado (por ejemplo, en) y mejorar la precisión, o --prompt para proporcionar contexto como nombres de hablantes que ayuden a orientar la transcripción.

Selección de modelo

El valor predeterminado es whisper-1, pero acepta un indicador --model, manteniéndote preparado para futuras variantes del modelo Whisper ofrecidas por OpenAI.

Casos de uso

Transcripción de reuniones o entrevistas

Graba una reunión o entrevista y luego ejecuta la habilidad sobre el archivo de audio para obtener una transcripción completa en texto. Usa --prompt con los nombres de los participantes para mejorar el reconocimiento de nombres de hablantes en el resultado.

Pipeline de transcripción automatizada

Integra el script en un cron job o flujo de trabajo de CI que recoja nuevos archivos de audio de un directorio y los transcriba automáticamente con openai-whisper-api, escribiendo los resultados en una carpeta de salida especificada.

Archivo de podcasts o notas de voz

Convierte una biblioteca de memos de voz o episodios de podcast en archivos de texto con capacidad de búsqueda mediante la automatización de la skill openai-whisper-api sobre un lote de archivos de audio.

Requisitos

OpenAI API Key (required) — Autentica las solicitudes a /v1/audio/transcriptions. Se establece mediante la variable de entorno OPENAI_API_KEY o en ~/.openclaw/openclaw.json.

Conectando a tu agente...

npx clawhub@latest install openai-whisper-api

239Instalaciones actuales

v1.0.0Versión

Requisitos

curlOpenAI API Key

Preguntas frecuentes

Reseñas

0 reseñas

Inicia sesión para escribir una reseña

Aún no hay reseñas. ¡Sé el primero en compartir tu experiencia!