openai-whisper-api

Name: openai-whisper-api
Author: OpenClaw

openai-whisper-api Skill-Übersicht

openai-whisper-api ist ein Skill, der den OpenAI-Endpunkt /v1/audio/transcriptions (Whisper) in ein unkompliziertes Shell-Skript einbettet. Gib eine beliebige Audiodatei an und erhalte in Sekunden ein Transkript als Klartext zurück. Er unterstützt Modellauswahl, Sprachhinweise, benutzerdefinierte Ausgabepfade und JSON-Ausgabe – alles über Befehlszeilen-Flags.

So verwenden Sie es

Step 1: Im Terminal ausführen oder auf AgentCellar installieren

npx clawhub@latest install openai-whisper-api

oder

Klicke oben auf der Seite auf Installieren für die Ein-Klick-Einrichtung

When to Use openai-whisper-api

Best Fit

Sie haben Audiodateien (z. B. .m4a, .ogg), die Sie schnell transkribieren möchten, ohne benutzerdefinierten API-Integrationscode zu schreiben.
Sie möchten die Transkription als Teil einer Shell-Pipeline oder eines skriptgesteuerten Workflows automatisieren.
Sie müssen einen Sprachhinweis oder einen Sprecher-Namen-Prompt übergeben, um die Transkriptionsgenauigkeit zu verbessern.
Sie möchten strukturierte JSON-Ausgabe von der Whisper API anstelle von reinem Text.

When Not to Use

Sie benötigen Echtzeit- oder Streaming-Transkription – diese Skill sendet vollständige Audiodateien an die API und ist nicht für Live-Audio geeignet.
Sie möchten keinen OPENAI_API_KEY festlegen, da der Skill kein alternatives Transkriptions-Backend hat.

Hauptfunktionen

Einfache Transkription mit einem einzigen Befehl

Führe ein einzelnes Shell-Skript mit dem Pfad zu deiner Audiodatei aus und erhalte standardmäßig ein .txt-Transkript daneben. Kein Boilerplate-API-Code erforderlich.

Flexible Ausgabeoptionen

Schreiben Sie die Ausgabe mit --out in einen benutzerdefinierten Pfad, oder fordern Sie mit --json rohe JSON-Daten von der API für die Weiterverarbeitung an.

Sprach- und Prompt-Hinweise

Verwende --language, um die gesprochene Sprache anzugeben (z. B. en), um die Genauigkeit zu verbessern, oder --prompt, um Kontext wie Sprechernamen bereitzustellen, die die Transkription unterstützen.

Modellauswahl

Standardmäßig wird whisper-1 verwendet, es wird jedoch ein --model-Flag akzeptiert, sodass Sie für zukünftige Whisper-Modellvarianten von OpenAI gerüstet sind.

Anwendungsfälle

Meeting- oder Interview-Transkription

Nehmen Sie ein Meeting oder Interview auf und führen Sie anschließend den Skill gegen die Audiodatei aus, um ein vollständiges Texttranskript zu erstellen. Übergeben Sie --prompt mit den Namen der Teilnehmer, um die Erkennung von Sprechernamen in der Ausgabe zu verbessern.

Automatisierte Transkriptionspipeline

Integrieren Sie das Skript in einen Cron-Job oder CI-Workflow, der neue Audiodateien aus einem Verzeichnis aufnimmt und diese automatisch transkribiert, wobei die Ergebnisse in einen festgelegten Ausgabeordner geschrieben werden.

Podcast- oder Sprachnotizen-Archivierung

Konvertieren Sie eine Bibliothek von Sprachmemos oder Podcast-Episoden in durchsuchbare Textdateien, indem Sie den openai-whisper-api-Skill skriptgesteuert auf eine Reihe von Audiodateien anwenden.

Voraussetzungen

OpenAI API Key (erforderlich) — Authentifiziert Anfragen an /v1/audio/transcriptions. Wird über die Umgebungsvariable OPENAI_API_KEY oder in ~/.openclaw/openclaw.json gesetzt.

Verbindung zum Agenten wird hergestellt...

npx clawhub@latest install openai-whisper-api

239Aktuelle Installationen

v1.0.0Version

Voraussetzungen

curlOpenAI API Key

FAQ

Bewertungen

0 Bewertungen

Anmelden, um eine Bewertung zu schreiben

Noch keine Bewertungen. Sei der Erste, der seine Erfahrungen teilt!