Transkribieren Sie Audiodateien mithilfe von OpenAIs Whisper API in Text — unterstützt mehrere Formate, Sprachen und Ausgabeoptionen über eine einfache CLI.
npx clawhub@latest install openai-whisper-apiVoraussetzungen
openai-whisper-api ist ein Skill, der den OpenAI-Endpunkt /v1/audio/transcriptions (Whisper) in ein unkompliziertes Shell-Skript einbettet. Gib eine beliebige Audiodatei an und erhalte in Sekunden ein Transkript als Klartext zurück. Er unterstützt Modellauswahl, Sprachhinweise, benutzerdefinierte Ausgabepfade und JSON-Ausgabe – alles über Befehlszeilen-Flags.
npx clawhub@latest install openai-whisper-apiKlicke oben auf der Seite auf Installieren für die Ein-Klick-Einrichtung
.m4a, .ogg), die Sie schnell transkribieren möchten, ohne benutzerdefinierten API-Integrationscode zu schreiben.OPENAI_API_KEY festlegen, da der Skill kein alternatives Transkriptions-Backend hat.Führe ein einzelnes Shell-Skript mit dem Pfad zu deiner Audiodatei aus und erhalte standardmäßig ein .txt-Transkript daneben. Kein Boilerplate-API-Code erforderlich.
Schreiben Sie die Ausgabe mit --out in einen benutzerdefinierten Pfad, oder fordern Sie mit --json rohe JSON-Daten von der API für die Weiterverarbeitung an.
Verwende --language, um die gesprochene Sprache anzugeben (z. B. en), um die Genauigkeit zu verbessern, oder --prompt, um Kontext wie Sprechernamen bereitzustellen, die die Transkription unterstützen.
Standardmäßig wird whisper-1 verwendet, es wird jedoch ein --model-Flag akzeptiert, sodass Sie für zukünftige Whisper-Modellvarianten von OpenAI gerüstet sind.
Nehmen Sie ein Meeting oder Interview auf und führen Sie anschließend den Skill gegen die Audiodatei aus, um ein vollständiges Texttranskript zu erstellen. Übergeben Sie --prompt mit den Namen der Teilnehmer, um die Erkennung von Sprechernamen in der Ausgabe zu verbessern.
Integrieren Sie das Skript in einen Cron-Job oder CI-Workflow, der neue Audiodateien aus einem Verzeichnis aufnimmt und diese automatisch transkribiert, wobei die Ergebnisse in einen festgelegten Ausgabeordner geschrieben werden.
Konvertieren Sie eine Bibliothek von Sprachmemos oder Podcast-Episoden in durchsuchbare Textdateien, indem Sie den openai-whisper-api-Skill skriptgesteuert auf eine Reihe von Audiodateien anwenden.
/v1/audio/transcriptions. Wird über die Umgebungsvariable OPENAI_API_KEY oder in ~/.openclaw/openclaw.json gesetzt.npx clawhub@latest install openai-whisper-apiVoraussetzungen
Anmelden, um eine Bewertung zu schreiben
Noch keine Bewertungen. Sei der Erste, der seine Erfahrungen teilt!