sherpa-onnx를 통해 완전히 오프라인으로 로컬에서 텍스트 음성 변환을 실행하세요 — 클라우드, API 키, 인터넷 연결이 필요하지 않습니다.
npx clawhub@latest install sherpa-onnx-tts요구 사항
sherpa-onnx-tts는 sherpa-onnx 런타임을 사용하여 AI 에이전트에 완전한 오프라인, 온디바이스 텍스트 음성 변환 기능을 제공합니다. sherpa-onnx 엔진을 감싸는 CLI 래퍼를 번들로 제공하며, 고품질 Piper 음성 모델(vits-piper-en_US-lessac-high)을 기본으로 탑재하고 있습니다. 모든 처리가 로컬에서 실행되므로 텍스트가 절대 외부로 전송되지 않으며, 이는 개인 정보 보호가 필요한 워크플로우 및 에어갭 환경에 적합합니다.
npx clawhub@latest install sherpa-onnx-tts이 페이지 상단의 설치 버튼을 클릭하면 원클릭으로 설정할 수 있습니다
.wav 파일을 생성하고 싶은 경우.전체 TTS 파이프라인은 sherpa-onnx 네이티브 런타임을 사용하여 로컬 머신에서 실행됩니다. 최초 모델 다운로드 이후에는 인터넷 연결, API 키, 사용 요금이 일절 필요하지 않습니다.
사전 빌드된 sherpa-onnx 런타임이 macOS (Universal 2), Linux x64, Windows x64용으로 자동 다운로드되므로, 수동 컴파일 없이 운영 체제에 맞는 올바른 네이티브 바이너리를 사용할 수 있습니다.
기본적으로 고품질 vits-piper-en_US-lessac-high 모델이 포함되어 있습니다. sherpa-onnx-tts의 tts-models 릴리스에서 다른 음성 모델을 가져와 SHERPA_ONNX_MODEL_DIR이 해당 모델을 가리키도록 설정할 수 있습니다.
단일 명령어로 음성을 .wav 파일로 합성하세요: sherpa-onnx-tts -o output.wav "Your text here". 플래그 또는 환경 변수를 통해 모델 파일, 토큰 파일, 데이터 디렉토리를 재정의할 수 있습니다.
모델 디렉토리에 여러 .onnx 파일이 포함된 경우, SHERPA_ONNX_MODEL_FILE을 설정하거나 --model-file을 전달하여 사용할 모델을 지정할 수 있습니다. 이를 통해 기본 디렉토리를 재구성하지 않고도 다중 모델 설정이 가능합니다.
AI 에이전트가 문서를 요약하고 이 스킬을 호출하여 음성 .wav 파일 내레이션을 생성합니다 — 파이프라인에 클라우드 의존성 없이 완전히 오프라인으로 처리됩니다.
법률 또는 의료 보조 에이전트가 민감한 내용을 소리 내어 읽어야 하는 경우가 있습니다. sherpa-onnx-tts를 사용하면 기밀 텍스트가 제3자 TTS API로 전송되지 않습니다.
개발자가 CLI를 루프로 스크립트하여 수십 개의 텍스트 스니펫을 로컬 애플리케이션용 .wav 파일로 변환하며, 호출당 비용 없이 속도 제한도 없습니다.
아웃바운드 인터넷 액세스가 차단되거나 제한된 환경에서, 이 스킬은 설정 중 런타임과 모델을 다운로드한 후 독립적으로 작동하는 TTS 솔루션을 제공합니다.
SHERPA_ONNX_RUNTIME_DIR) — 운영 체제에 맞는 압축 해제된 sherpa-onnx 네이티브 런타임 경로. 설치 중 자동으로 다운로드됩니다.SHERPA_ONNX_MODEL_DIR) — 압축 해제된 음성 모델 폴더 경로 (예: vits-piper-en_US-lessac-high). 설치 중 자동으로 다운로드됩니다.SHERPA_ONNX_MODEL_FILE) (선택 사항) — 모델 디렉토리에 여러 모델이 존재할 경우 특정 .onnx 파일을 지정합니다.npx clawhub@latest install sherpa-onnx-tts요구 사항
리뷰를 작성하려면 로그인
아직 리뷰가 없습니다. 첫 번째로 경험을 공유해 보세요!