Transcrivez des fichiers audio en texte grâce à l'API Whisper d'OpenAI — prend en charge plusieurs formats, langues et options de sortie via une interface CLI simple.
npx clawhub@latest install openai-whisper-apiPrérequis
openai-whisper-api est une compétence qui encapsule le point de terminaison /v1/audio/transcriptions d'OpenAI (Whisper) dans un script shell simple. Pointez-le vers n'importe quel fichier audio et obtenez une transcription en texte brut en quelques secondes. Il prend en charge la sélection de modèle, les indications de langue, les chemins de sortie personnalisés et la sortie JSON — tout cela via des indicateurs en ligne de commande.
npx clawhub@latest install openai-whisper-apiCliquez sur le bouton Installer en haut de cette page pour une configuration en un clic
.m4a, .ogg) que vous devez transcrire rapidement sans écrire de code d'intégration API personnalisé.OPENAI_API_KEY, car la compétence ne dispose d'aucun backend de transcription alternatif.Exécutez un simple script shell avec le chemin vers votre fichier audio et recevez par défaut une transcription en .txt à côté de celui-ci. Aucun code API passe-partout n'est requis.
Écrivez la sortie dans un chemin personnalisé avec --out, ou demandez du JSON brut depuis l'API avec --json pour un traitement en aval.
Utilisez --language pour spécifier la langue parlée (par exemple en) afin d'améliorer la précision, ou --prompt pour fournir un contexte tel que des noms de locuteurs permettant de guider la transcription.
Par défaut whisper-1, mais accepte un indicateur --model, vous permettant d'être prêt pour les futures variantes du modèle Whisper proposées par OpenAI.
Enregistrez une réunion ou un entretien, puis exécutez la compétence sur le fichier audio pour produire une transcription textuelle complète. Passez --prompt avec les noms des participants pour améliorer la reconnaissance des noms des intervenants dans le résultat.
Intégrez le script dans une tâche cron ou un workflow CI qui récupère les nouveaux fichiers audio depuis un répertoire et les transcrit automatiquement, en écrivant les résultats dans un dossier de sortie spécifié.
Convertissez une bibliothèque de mémos vocaux ou d'épisodes de podcasts en fichiers texte consultables en scriptant la compétence openai-whisper-api sur un lot de fichiers audio.
/v1/audio/transcriptions. Défini via la variable d'environnement OPENAI_API_KEY ou dans ~/.openclaw/openclaw.json.npx clawhub@latest install openai-whisper-apiPrérequis
Se connecter pour écrire un avis
Aucun avis pour l'instant. Soyez le premier à partager votre expérience !