Trascrivi file audio in testo utilizzando l'API Whisper di OpenAI — supporta più formati, lingue e opzioni di output tramite una semplice CLI.
npx clawhub@latest install openai-whisper-apiRequisiti
openai-whisper-api è una skill che racchiude l'endpoint /v1/audio/transcriptions di OpenAI (Whisper) in un semplice script shell. Puntalo su qualsiasi file audio e ottieni una trascrizione in testo normale in pochi secondi. Supporta la selezione del modello, suggerimenti sulla lingua, percorsi di output personalizzati e output JSON — tutto tramite flag da riga di comando.
npx clawhub@latest install openai-whisper-apiFai clic sul pulsante Installa in cima a questa pagina per la configurazione con un clic
.m4a, .ogg) che devi trascrivere rapidamente senza dover scrivere codice personalizzato per l'integrazione con le API.OPENAI_API_KEY, poiché la skill non dispone di un backend di trascrizione alternativo.Esegui un singolo script shell con il percorso del tuo file audio e ricevi di default un trascritto .txt accanto ad esso. Nessun codice API standard richiesto.
Scrivi l'output in un percorso personalizzato con --out, oppure richiedi JSON grezzo dall'API con --json per l'elaborazione successiva.
Usa --language per specificare la lingua parlata (ad es. en) e ottenere una maggiore precisione, oppure --prompt per fornire contesto come i nomi dei parlanti che aiutano a guidare la trascrizione.
Il valore predefinito è whisper-1, ma accetta un flag --model, tenendoti pronto per future varianti del modello Whisper offerte da OpenAI.
Registra una riunione o un'intervista, quindi esegui la skill sul file audio per produrre una trascrizione testuale completa. Passa --prompt con i nomi dei partecipanti per migliorare il riconoscimento dei nomi dei parlanti nell'output.
Integra lo script in un cron job o in un flusso di lavoro CI che preleva nuovi file audio da una directory e li trascrive automaticamente, scrivendo i risultati in una cartella di output specificata.
Converti una libreria di memo vocali o episodi di podcast in file di testo ricercabili, applicando la skill openai-whisper-api tramite script su un batch di file audio.
/v1/audio/transcriptions. Impostalo tramite la variabile d'ambiente OPENAI_API_KEY o in ~/.openclaw/openclaw.json.npx clawhub@latest install openai-whisper-apiRequisiti
Accedi per scrivere una recensione
Nessuna recensione ancora. Sii il primo a condividere la tua esperienza!