openai-whisper-api를 사용하여 오디오 파일을 텍스트로 변환합니다 — 간단한 CLI를 통해 여러 형식, 언어 및 출력 옵션을 지원합니다.
npx clawhub@latest install openai-whisper-api요구 사항
openai-whisper-api는 OpenAI의 /v1/audio/transcriptions 엔드포인트(Whisper)를 간단한 셸 스크립트로 래핑한 스킬입니다. 오디오 파일을 지정하면 몇 초 안에 일반 텍스트 트랜스크립트를 반환합니다. 모델 선택, 언어 힌트, 사용자 지정 출력 경로, JSON 출력을 지원하며, 이 모든 기능은 커맨드라인 플래그를 통해 사용할 수 있습니다.
npx clawhub@latest install openai-whisper-api이 페이지 상단의 설치 버튼을 클릭하면 원클릭으로 설정할 수 있습니다
.m4a, .ogg)을 빠르게 텍스트로 변환해야 하는 경우.OPENAI_API_KEY 설정이 불편한 경우, 이 스킬에는 대체 전사 백엔드가 없습니다.오디오 파일 경로를 지정하여 단일 셸 스크립트를 실행하면 기본적으로 동일한 위치에 .txt 트랜스크립트 파일이 생성됩니다. 별도의 API 보일러플레이트 코드가 필요하지 않습니다.
--out을 사용하여 사용자 지정 경로에 출력을 저장하거나, --json을 사용하여 API에서 원시 JSON을 요청하여 후속 처리에 활용하세요.
--language를 사용하여 더 나은 정확도를 위해 음성 언어(예: en)를 지정하거나, --prompt를 사용하여 화자 이름과 같은 컨텍스트를 제공하여 전사를 안내할 수 있습니다.
기본값은 whisper-1이지만 --model 플래그를 허용하여, OpenAI가 제공하는 향후 Whisper 모델 변형에 대비할 수 있습니다.
회의나 인터뷰를 녹음한 후, 오디오 파일에 대해 스킬을 실행하여 전체 텍스트 전사본을 생성합니다. 출력 결과에서 화자 이름 인식을 개선하려면 참가자 이름과 함께 --prompt를 전달하세요.
스크립트를 cron 작업 또는 CI 워크플로우에 통합하여 디렉토리에서 새로운 오디오 파일을 자동으로 가져와 전사하고, 결과를 지정된 출력 폴더에 저장합니다. 이 과정에서 openai-whisper-api 스킬을 활용하여 전사 작업을 자동화할 수 있습니다.
음성 메모나 팟캐스트 에피소드 라이브러리를 검색 가능한 텍스트 파일로 변환하려면, 여러 오디오 파일에 대해 openai-whisper-api 스킬을 일괄 처리 방식으로 스크립팅하세요.
/v1/audio/transcriptions에 대한 요청을 인증합니다. OPENAI_API_KEY 환경 변수 또는 ~/.openclaw/openclaw.json을 통해 설정합니다.npx clawhub@latest install openai-whisper-api요구 사항
리뷰를 작성하려면 로그인
아직 리뷰가 없습니다. 첫 번째로 경험을 공유해 보세요!