Browser & Automation🗣️

sherpa-onnx-tts

Name: sherpa-onnx-tts
Author: OpenClaw

sherpa-onnx를 통해 완전히 오프라인으로 로컬에서 텍스트 음성 변환을 실행하세요 — 클라우드, API 키, 인터넷 연결이 필요하지 않습니다.

OpenClaw 제작v1.0.0

에이전트에 연결 중...

npx clawhub@latest install sherpa-onnx-tts

14현재 설치 수

v1.0.0버전

요구 사항

sherpa-onnx Runtime DirectoryTTS Model DirectoryTTS Model File Override(optional)

sherpa-onnx-tts 스킬 개요

sherpa-onnx-tts는 sherpa-onnx 런타임을 사용하여 AI 에이전트에 완전한 오프라인, 온디바이스 텍스트 음성 변환 기능을 제공합니다. sherpa-onnx 엔진을 감싸는 CLI 래퍼를 번들로 제공하며, 고품질 Piper 음성 모델(vits-piper-en_US-lessac-high)을 기본으로 탑재하고 있습니다. 모든 처리가 로컬에서 실행되므로 텍스트가 절대 외부로 전송되지 않으며, 이는 개인 정보 보호가 필요한 워크플로우 및 에어갭 환경에 적합합니다.

사용 방법

Step 1: 터미널에서 실행하거나 AgentCellar에 설치

npx clawhub@latest install sherpa-onnx-tts

또는

이 페이지 상단의 설치 버튼을 클릭하면 원클릭으로 설정할 수 있습니다

When to Use sherpa-onnx-tts

Best Fit

개인 정보 보호 우선 음성 출력 — 텍스트를 클라우드 API로 전송하지 않고 음성을 합성해야 하는 경우(예: 민감한 문서, 개인 데이터).
오프라인 또는 에어갭 환경 — 에이전트가 안정적인 인터넷 접속 없이 실행되지만 여전히 오디오 출력이 필요한 경우.
비용 절감 — 문자당 또는 요청당 요금 없이 TTS 호출을 무제한으로 사용하고 싶은 경우.
스크립트 기반 오디오 생성 — CLI 명령어나 에이전트 도구를 통해 프로그래밍 방식으로 .wav 파일을 생성하고 싶은 경우.

When Not to Use

고품질의 표현력 있는 신경망 음성(예: ElevenLabs 수준)이 필요한 경우 — 로컬 Piper 모델은 좋은 결과를 제공하지만 스튜디오급은 아닙니다.
대화형 음성 애플리케이션을 위해 초저지연의 실시간 스트리밍 TTS가 필요한 경우.
사용 중인 플랫폼이 x64 macOS, Linux 또는 Windows가 아닌 경우 — 현재 다른 아키텍처는 번들로 제공되지 않습니다.

주요 기능

완전 오프라인 — 클라우드 또는 API 키 불필요

전체 TTS 파이프라인은 sherpa-onnx 네이티브 런타임을 사용하여 로컬 머신에서 실행됩니다. 최초 모델 다운로드 이후에는 인터넷 연결, API 키, 사용 요금이 일절 필요하지 않습니다.

크로스 플랫폼 런타임 번들

사전 빌드된 sherpa-onnx 런타임이 macOS (Universal 2), Linux x64, Windows x64용으로 자동 다운로드되므로, 수동 컴파일 없이 운영 체제에 맞는 올바른 네이티브 바이너리를 사용할 수 있습니다.

교체 가능한 음성 모델

기본적으로 고품질 vits-piper-en_US-lessac-high 모델이 포함되어 있습니다. sherpa-onnx-tts의 tts-models 릴리스에서 다른 음성 모델을 가져와 SHERPA_ONNX_MODEL_DIR이 해당 모델을 가리키도록 설정할 수 있습니다.

간단한 CLI를 통한 WAV 파일 출력

단일 명령어로 음성을 .wav 파일로 합성하세요: sherpa-onnx-tts -o output.wav "Your text here". 플래그 또는 환경 변수를 통해 모델 파일, 토큰 파일, 데이터 디렉토리를 재정의할 수 있습니다.

구성 가능한 모델 선택

모델 디렉토리에 여러 .onnx 파일이 포함된 경우, SHERPA_ONNX_MODEL_FILE을 설정하거나 --model-file을 전달하여 사용할 모델을 지정할 수 있습니다. 이를 통해 기본 디렉토리를 재구성하지 않고도 다중 모델 설정이 가능합니다.

활용 사례

에이전트 생성 오디오 내레이션

AI 에이전트가 문서를 요약하고 이 스킬을 호출하여 음성 .wav 파일 내레이션을 생성합니다 — 파이프라인에 클라우드 의존성 없이 완전히 오프라인으로 처리됩니다.

개인정보 보호가 필요한 음성 출력

법률 또는 의료 보조 에이전트가 민감한 내용을 소리 내어 읽어야 하는 경우가 있습니다. sherpa-onnx-tts를 사용하면 기밀 텍스트가 제3자 TTS API로 전송되지 않습니다.

배치 오디오 파일 생성

개발자가 CLI를 루프로 스크립트하여 수십 개의 텍스트 스니펫을 로컬 애플리케이션용 .wav 파일로 변환하며, 호출당 비용 없이 속도 제한도 없습니다.

에어갭 또는 제한된 네트워크 환경 배포

아웃바운드 인터넷 액세스가 차단되거나 제한된 환경에서, 이 스킬은 설정 중 런타임과 모델을 다운로드한 후 독립적으로 작동하는 TTS 솔루션을 제공합니다.

요구 사항

런타임 디렉토리 (SHERPA_ONNX_RUNTIME_DIR) — 운영 체제에 맞는 압축 해제된 sherpa-onnx 네이티브 런타임 경로. 설치 중 자동으로 다운로드됩니다.
모델 디렉토리 (SHERPA_ONNX_MODEL_DIR) — 압축 해제된 음성 모델 폴더 경로 (예: vits-piper-en_US-lessac-high). 설치 중 자동으로 다운로드됩니다.
모델 파일 재정의 (SHERPA_ONNX_MODEL_FILE) (선택 사항) — 모델 디렉토리에 여러 모델이 존재할 경우 특정 .onnx 파일을 지정합니다.

에이전트에 연결 중...

npx clawhub@latest install sherpa-onnx-tts

14현재 설치 수

v1.0.0버전

요구 사항

sherpa-onnx Runtime DirectoryTTS Model DirectoryTTS Model File Override(optional)

자주 묻는 질문

리뷰

0개 리뷰

리뷰를 작성하려면 로그인

아직 리뷰가 없습니다. 첫 번째로 경험을 공유해 보세요!