openai-whisper-api

Name: openai-whisper-api
Author: OpenClaw

À la une

Transcrivez des fichiers audio en texte grâce à l'API Whisper d'OpenAI — prend en charge plusieurs formats, langues et options de sortie via une interface CLI simple.

par OpenClawv1.0.0

Connexion à votre agent...

npx clawhub@latest install openai-whisper-api

239Installations actuelles

v1.0.0Version

Prérequis

curlOpenAI API Key

Aperçu du skill openai-whisper-api

openai-whisper-api est une compétence qui encapsule le point de terminaison /v1/audio/transcriptions d'OpenAI (Whisper) dans un script shell simple. Pointez-le vers n'importe quel fichier audio et obtenez une transcription en texte brut en quelques secondes. Il prend en charge la sélection de modèle, les indications de langue, les chemins de sortie personnalisés et la sortie JSON — tout cela via des indicateurs en ligne de commande.

Comment l’utiliser

Step 1: Exécutez dans votre terminal ou installez ce skill sur AgentCellar

npx clawhub@latest install openai-whisper-api

Cliquez sur le bouton Installer en haut de cette page pour une configuration en un clic

When to Use openai-whisper-api

Best Fit

Vous avez des fichiers audio (par exemple .m4a, .ogg) que vous devez transcrire rapidement sans écrire de code d'intégration API personnalisé.
Vous souhaitez automatiser la transcription dans le cadre d'un pipeline shell ou d'un flux de travail scripté.
Vous devez fournir un indicateur de langue ou une invite de nom de locuteur pour améliorer la précision de la transcription.
Vous souhaitez obtenir une sortie JSON structurée depuis l'API Whisper plutôt que du texte brut.

When Not to Use

Vous avez besoin d'une transcription en temps réel ou en streaming — cette compétence envoie des fichiers audio complets à l'API et n'est pas adaptée à l'audio en direct.
Vous n'êtes pas à l'aise avec la définition d'une OPENAI_API_KEY, car la compétence ne dispose d'aucun backend de transcription alternatif.

Fonctionnalités clés

Transcription simple en une seule commande

Exécutez un simple script shell avec le chemin vers votre fichier audio et recevez par défaut une transcription en .txt à côté de celui-ci. Aucun code API passe-partout n'est requis.

Options de sortie flexibles

Écrivez la sortie dans un chemin personnalisé avec --out, ou demandez du JSON brut depuis l'API avec --json pour un traitement en aval.

Indices de langue et d'invite

Utilisez --language pour spécifier la langue parlée (par exemple en) afin d'améliorer la précision, ou --prompt pour fournir un contexte tel que des noms de locuteurs permettant de guider la transcription.

Sélection du modèle

Par défaut whisper-1, mais accepte un indicateur --model, vous permettant d'être prêt pour les futures variantes du modèle Whisper proposées par OpenAI.

Cas d'utilisation

Transcription de réunion ou d'entretien

Enregistrez une réunion ou un entretien, puis exécutez la compétence sur le fichier audio pour produire une transcription textuelle complète. Passez --prompt avec les noms des participants pour améliorer la reconnaissance des noms des intervenants dans le résultat.

Pipeline de transcription automatisée

Intégrez le script dans une tâche cron ou un workflow CI qui récupère les nouveaux fichiers audio depuis un répertoire et les transcrit automatiquement, en écrivant les résultats dans un dossier de sortie spécifié.

Archivage de podcasts ou de mémos vocaux

Convertissez une bibliothèque de mémos vocaux ou d'épisodes de podcasts en fichiers texte consultables en scriptant la compétence openai-whisper-api sur un lot de fichiers audio.

Prérequis

OpenAI API Key (requis) — Authentifie les requêtes vers /v1/audio/transcriptions. Défini via la variable d'environnement OPENAI_API_KEY ou dans ~/.openclaw/openclaw.json.

Connexion à votre agent...

npx clawhub@latest install openai-whisper-api

239Installations actuelles

v1.0.0Version

Prérequis

curlOpenAI API Key

FAQ

Avis

0 avis

Se connecter pour écrire un avis

Aucun avis pour l'instant. Soyez le premier à partager votre expérience !