OpenAI의 Whisper 음성-텍스트 변환 모델로 오디오 파일을 로컬에서 변환 — API 키 불필요, 다양한 언어 및 출력 형식 지원.
npx clawhub@latest install openai-whisperWhisper (CLI)는 OpenAI의 강력한 음성-텍스트 변환 모델을 사용자의 컴퓨터에 직접 제공합니다. 다양한 형식의 오디오 파일을 텍스트로 변환할 수 있으며, 음성을 영어로 번역하는 것도 가능합니다 — 외부 API로 데이터를 전송하지 않고 모두 처리됩니다. 모델은 한 번 다운로드되어 로컬에 캐시되므로, 이후 실행은 빠르고 완전히 오프라인으로 동작합니다.
npx clawhub@latest install openai-whisper이 페이지 상단의 설치 버튼을 클릭하면 원클릭으로 설정할 수 있습니다
.srt)을 생성해야 합니다.Openai Whisper는 사용자의 하드웨어에서 완전히 실행됩니다. OpenAI 계정, API 키, 외부 서버로의 데이터 전송이 일절 필요 없습니다 — 모델 가중치를 한 번만 다운로드하면 오프라인에서 바로 트랜스크립션을 사용할 수 있습니다.
--output_format 플래그를 통해 txt, srt, vtt, tsv, json 출력 형식을 지원하며, 단일 명령으로 캡션, 자막 또는 일반 텍스트 트랜스크립트를 손쉽게 생성할 수 있습니다.
--task translate를 전달하면 비영어 음성을 자동으로 영어 텍스트로 번역합니다. 이 기능은 전사에 사용되는 것과 동일한 모델 가중치를 기반으로 작동합니다.
전사 속도와 정확도의 균형을 맞추기 위해 다양한 모델(tiny, base, small, medium, large, turbo) 중에서 선택할 수 있습니다. 이 설치의 기본값은 turbo입니다. 모델은 최초 다운로드 후 ~/.cache/whisper에 캐시됩니다.
녹음된 .mp3 또는 .m4a 파일을 Openai Whisper에 --model medium --output_format txt 옵션과 함께 사용하면, 민감한 대화를 서드파티 서비스에 업로드하지 않고도 깔끔한 텍스트 전사본을 얻을 수 있습니다.
--output_format srt 옵션을 사용하여 비디오 편집기나 미디어 플레이어에 바로 가져올 수 있는 자막 파일을 생성하세요. 로컬 환경에서 녹화 영상에 자막을 추가하려는 콘텐츠 제작자에게 이상적입니다.
외국어 오디오에 --task translate를 실행하여 한 번에 영어 트랜스크립트를 얻을 수 있으며, 다국어 소스 자료를 다루는 연구자나 저널리스트에게 유용합니다.
npx clawhub@latest install openai-whisper리뷰를 작성하려면 로그인
아직 리뷰가 없습니다. 첫 번째로 경험을 공유해 보세요!