openai-whisper-api

Name: openai-whisper-api
Author: OpenClaw

In evidenza

Trascrivi file audio in testo utilizzando l'API Whisper di OpenAI — supporta più formati, lingue e opzioni di output tramite una semplice CLI.

di OpenClawv1.0.0

Connessione all'agente...

npx clawhub@latest install openai-whisper-api

239Installazioni attuali

v1.0.0Versione

Requisiti

curlOpenAI API Key

Panoramica dello skill openai-whisper-api

openai-whisper-api è una skill che racchiude l'endpoint /v1/audio/transcriptions di OpenAI (Whisper) in un semplice script shell. Puntalo su qualsiasi file audio e ottieni una trascrizione in testo normale in pochi secondi. Supporta la selezione del modello, suggerimenti sulla lingua, percorsi di output personalizzati e output JSON — tutto tramite flag da riga di comando.

Come usarlo

Step 1: Esegui nel terminale o installa questo skill su AgentCellar

npx clawhub@latest install openai-whisper-api

oppure

Fai clic sul pulsante Installa in cima a questa pagina per la configurazione con un clic

When to Use openai-whisper-api

Best Fit

Hai file audio (ad es. .m4a, .ogg) che devi trascrivere rapidamente senza dover scrivere codice personalizzato per l'integrazione con le API.
Vuoi automatizzare la trascrizione come parte di una pipeline shell o di un flusso di lavoro con script.
Hai bisogno di fornire un suggerimento sulla lingua o un prompt con il nome del parlante per migliorare la precisione della trascrizione.
Vuoi un output JSON strutturato dall'API Whisper invece di testo normale.

When Not to Use

Hai bisogno di trascrizione in tempo reale o in streaming — questa skill invia file audio completi all'API e non è adatta per l'audio in diretta.
Non sei a tuo agio nell'impostare un OPENAI_API_KEY, poiché la skill non dispone di un backend di trascrizione alternativo.

Funzionalità principali

Trascrizione semplice con un solo comando

Esegui un singolo script shell con il percorso del tuo file audio e ricevi di default un trascritto .txt accanto ad esso. Nessun codice API standard richiesto.

Opzioni di output flessibili

Scrivi l'output in un percorso personalizzato con --out, oppure richiedi JSON grezzo dall'API con --json per l'elaborazione successiva.

Suggerimenti su lingua e prompt

Usa --language per specificare la lingua parlata (ad es. en) e ottenere una maggiore precisione, oppure --prompt per fornire contesto come i nomi dei parlanti che aiutano a guidare la trascrizione.

Selezione del modello

Il valore predefinito è whisper-1, ma accetta un flag --model, tenendoti pronto per future varianti del modello Whisper offerte da OpenAI.

Casi d'uso

Trascrizione di riunioni o interviste

Registra una riunione o un'intervista, quindi esegui la skill sul file audio per produrre una trascrizione testuale completa. Passa --prompt con i nomi dei partecipanti per migliorare il riconoscimento dei nomi dei parlanti nell'output.

Pipeline di trascrizione automatizzata

Integra lo script in un cron job o in un flusso di lavoro CI che preleva nuovi file audio da una directory e li trascrive automaticamente, scrivendo i risultati in una cartella di output specificata.

Archiviazione di podcast o note vocali

Converti una libreria di memo vocali o episodi di podcast in file di testo ricercabili, applicando la skill openai-whisper-api tramite script su un batch di file audio.

Requisiti

OpenAI API Key (required) — Autentica le richieste verso /v1/audio/transcriptions. Impostalo tramite la variabile d'ambiente OPENAI_API_KEY o in ~/.openclaw/openclaw.json.

Connessione all'agente...

npx clawhub@latest install openai-whisper-api

239Installazioni attuali

v1.0.0Versione

Requisiti

curlOpenAI API Key

FAQ

Recensioni

0 recensioni

Accedi per scrivere una recensione

Nessuna recensione ancora. Sii il primo a condividere la tua esperienza!