ElevenLabsのAIボイスを、使い慣れたMacスタイルの`say`インターフェースと表現力豊かなオーディオタグでコマンドラインから使用できます。
npx clawhub@latest install sag動作要件
Sag は、macOS に内蔵された say コマンドにインスパイアされた UX で、ElevenLabs のテキスト読み上げ機能をターミナルに提供する CLI ツールです。表現豊かな eleven_v3 をはじめとする ElevenLabs の最新モデルを搭載しており、ローカルでの音声再生、複数のボイス、感情・読み方タグ、きめ細かな発音制御をサポートしています。一度インストールするだけで、任意のテキスト、スクリプト、または AI エージェントのレスポンスから高品質な音声を生成できます。
npx clawhub@latest install sagこのページ上部のインストールボタンをクリックするとワンクリックでセットアップできます
[whispers]、[excited]、[sarcastic]などのタグを使って、個性と感情を持った音声返答を生成する必要がある。eleven_v3、eleven_multilingual_v2、eleven_flash_v2_5)が必要なTTSワークフローをスクリプト化している。sayコマンドの代替として利用したい。<phoneme> サポートが必要な場合;Sag はその機能を公開していません。say コマンドで十分です。eleven_v3(表現力豊か、デフォルト)、eleven_multilingual_v2(安定、多言語対応)、eleven_flash_v2_5(高速)の中から選択し、各ユースケースに応じて品質、速度、言語カバレッジのバランスを調整できます。
[whispers](ささやき)、[shouts](叫び)、[laughs](笑い)、[excited](興奮)、[sarcastic](皮肉)などのタグを使って、読み上げの指示をテキストに直接埋め込むことができます。ポーズ(間)の制御には、SSMLの代わりに[pause]、[short pause]、[long pause]を使用します。
-v フラグを使用して名前またはIDでElevenLabsの音声を指定し、ELEVENLABS_VOICE_ID / SAG_VOICE_ID でデフォルトを設定し、sag voices で利用可能な音声を確認できます。
単語を読み仮名で書き直したり、ハイフンを使用したり、大文字・小文字を調整することで、誤った発音を修正できます。--normalize auto|off フラグは数字、単位、URLを処理し、--lang は言語固有の正規化をガイドします。
sag prompting を実行すると、現在選択されているモデルで最良の結果を得るためのテキストの表現とフォーマットに関する、モデル固有のガイダンスを取得できます。
-o フラグを使用して、生成された音声を直接ディスクに保存します(例:-o /tmp/reply.mp3)。これにより、AIエージェントの応答や後続のワークフローに音声ファイルを添付することが簡単になります。
AIエージェントが特定のキャラクターで音声応答を生成します — 例: sag -v Clawd -o /tmp/reply.mp3 "[excited] Here's what I found!" — その後、即座に再生できるようにファイルパスを返答に含めます。
シェルスクリプトで sag にテキストまたはドキュメントのコンテンツを渡し、--normalize auto を活用して数字やURLをきれいに処理しながら、ナレーション付き音声ファイルを一括生成します。
制作用のボイスオーバーを決定する前に、ターミナルからさまざまなElevenLabsのボイスや話し方のスタイル([whispers]、[sarcastic]、[sings])をすばやく試聴できます。
eleven_multilingual_v2 を --lang de|fr|es|... と組み合わせて使用することで、英語以外の言語に対して正しく正規化されたTTSを生成できます。ローカライズされたコンテンツパイプラインに適しています。
ELEVENLABS_API_KEY(推奨)またはSAG_API_KEYとして設定してください。ELEVENLABS_VOICE_IDまたはSAG_VOICE_IDを設定することで、毎回の呼び出しで-vを指定する手間を省けます。npx clawhub@latest install sag動作要件
レビューを書くにはログイン
まだレビューはありません。最初の体験をシェアしましょう!