Транскрибируйте аудиофайлы в текст с помощью Whisper API от OpenAI — поддерживает множество форматов, языков и параметров вывода через простой CLI.
npx clawhub@latest install openai-whisper-apiТребования
openai-whisper-api — это навык, который оборачивает эндпоинт OpenAI /v1/audio/transcriptions (Whisper) в простой shell-скрипт. Укажите любой аудиофайл и получите текстовую расшифровку за считанные секунды. Поддерживается выбор модели, указание языка, пользовательские пути вывода и JSON-вывод — всё через флаги командной строки.
npx clawhub@latest install openai-whisper-apiНажмите кнопку Установить вверху страницы для настройки в один клик
.m4a, .ogg), которые нужно быстро транскрибировать без написания собственного кода интеграции с API.OPENAI_API_KEY, поскольку у навыка нет альтернативного бэкенда для транскрипции.Запустите единственный shell-скрипт, указав путь к аудиофайлу, и по умолчанию получите рядом с ним готовый транскрипт в формате .txt. Никакого шаблонного кода для работы с API не требуется.
Записывайте вывод по произвольному пути с помощью --out или запрашивайте необработанный JSON из API с помощью --json для последующей обработки.
Используйте --language для указания языка речи (например, en) для повышения точности или --prompt для предоставления контекста, например имён говорящих, которые помогают направлять транскрипцию.
По умолчанию используется whisper-1, но принимает флаг --model, что позволяет вам быть готовыми к будущим вариантам моделей Whisper, предлагаемых OpenAI.
Запишите встречу или интервью, затем запустите навык openai-whisper-api для аудиофайла, чтобы получить полную текстовую транскрипцию. Передайте --prompt с именами участников, чтобы улучшить распознавание имён говорящих в результате.
Интегрируйте скрипт в задание cron или рабочий процесс CI, который автоматически подхватывает новые аудиофайлы из указанной директории и транскрибирует их, записывая результаты в заданную папку вывода.
Преобразуйте библиотеку голосовых заметок или эпизодов подкастов в доступные для поиска текстовые файлы, запустив openai-whisper-api в пакетном режиме для обработки нескольких аудиофайлов.
/v1/audio/transcriptions. Устанавливается через переменную окружения OPENAI_API_KEY или в файле ~/.openclaw/openclaw.json.npx clawhub@latest install openai-whisper-apiТребования
Войдите, чтобы написать отзыв
Отзывов пока нет. Будьте первым, кто поделится своим опытом!