openai-whisper-api

Name: openai-whisper-api
Author: OpenClaw

Обзор скилла openai-whisper-api

openai-whisper-api — это навык, который оборачивает эндпоинт OpenAI /v1/audio/transcriptions (Whisper) в простой shell-скрипт. Укажите любой аудиофайл и получите текстовую расшифровку за считанные секунды. Поддерживается выбор модели, указание языка, пользовательские пути вывода и JSON-вывод — всё через флаги командной строки.

Как использовать

Step 1: Запустите в терминале или установите этот скилл на AgentCellar

npx clawhub@latest install openai-whisper-api

или

Нажмите кнопку Установить вверху страницы для настройки в один клик

When to Use openai-whisper-api

Best Fit

У вас есть аудиофайлы (например, .m4a, .ogg), которые нужно быстро транскрибировать без написания собственного кода интеграции с API.
Вы хотите автоматизировать транскрибирование в рамках конвейера оболочки или скриптового рабочего процесса.
Вам нужно передать подсказку языка или имя говорящего для повышения точности транскрибирования.
Вы хотите получать структурированный JSON-вывод из Whisper API вместо обычного текста.

When Not to Use

Вам нужна транскрипция в реальном времени или потоковая транскрипция — этот навык отправляет в API полные аудиофайлы и не подходит для обработки живого звука.
Вы не готовы указывать OPENAI_API_KEY, поскольку у навыка нет альтернативного бэкенда для транскрипции.

Ключевые возможности

Простая транскрипция одной командой

Запустите единственный shell-скрипт, указав путь к аудиофайлу, и по умолчанию получите рядом с ним готовый транскрипт в формате .txt. Никакого шаблонного кода для работы с API не требуется.

Гибкие параметры вывода

Записывайте вывод по произвольному пути с помощью --out или запрашивайте необработанный JSON из API с помощью --json для последующей обработки.

Подсказки по языку и промпту

Используйте --language для указания языка речи (например, en) для повышения точности или --prompt для предоставления контекста, например имён говорящих, которые помогают направлять транскрипцию.

Выбор модели

По умолчанию используется whisper-1, но принимает флаг --model, что позволяет вам быть готовыми к будущим вариантам моделей Whisper, предлагаемых OpenAI.

Сценарии использования

Транскрипция встречи или интервью

Запишите встречу или интервью, затем запустите навык openai-whisper-api для аудиофайла, чтобы получить полную текстовую транскрипцию. Передайте --prompt с именами участников, чтобы улучшить распознавание имён говорящих в результате.

Автоматизированный конвейер транскрипции

Интегрируйте скрипт в задание cron или рабочий процесс CI, который автоматически подхватывает новые аудиофайлы из указанной директории и транскрибирует их, записывая результаты в заданную папку вывода.

Архивирование подкастов или голосовых заметок

Преобразуйте библиотеку голосовых заметок или эпизодов подкастов в доступные для поиска текстовые файлы, запустив openai-whisper-api в пакетном режиме для обработки нескольких аудиофайлов.

Требования

OpenAI API Key (обязательно) — Аутентифицирует запросы к /v1/audio/transcriptions. Устанавливается через переменную окружения OPENAI_API_KEY или в файле ~/.openclaw/openclaw.json.

Подключение к агенту...

npx clawhub@latest install openai-whisper-api

239Текущие установки

v1.0.0Версия

Требования

curlOpenAI API Key

Часто задаваемые вопросы

Отзывы

0 отзывов

Войдите, чтобы написать отзыв

Отзывов пока нет. Будьте первым, кто поделится своим опытом!