OpenAI の Whisper 音声認識モデルを使ってローカルで音声ファイルを文字起こし — API キー不要、複数言語と出力形式に対応。
npx clawhub@latest install openai-whisperWhisper (CLI) は、OpenAI の強力な音声認識モデルをお使いのマシンに直接導入します。幅広い形式の音声ファイルを文字起こしでき、音声を英語に翻訳することも可能です — すべて外部 API にデータを送信することなく実行できます。モデルは一度ダウンロードされるとローカルにキャッシュされるため、2 回目以降の実行は高速で、完全オフラインで動作します。
npx clawhub@latest install openai-whisperこのページ上部のインストールボタンをクリックするとワンクリックでセットアップできます
.srt)を生成する必要がある場合。Openai Whisper はお使いのハードウェア上で完全に動作します。OpenAIアカウントもAPIキーも不要で、外部サーバーへのデータ送信もありません。モデルの重みを一度ダウンロードするだけで、オフラインで文字起こしが可能です。
--output_format フラグを使用して、txt、srt、vtt、tsv、json の出力フォーマットに対応しており、単一のコマンドからキャプション、字幕、またはプレーンなトランスクリプトを簡単に生成できます。
--task translate を渡すことで、文字起こしに使用されるのと同じモデルの重みを利用し、英語以外の音声を自動的に英語テキストに翻訳します。
文字起こしの速度と精度のバランスを取るために、さまざまなモデル(tiny、base、small、medium、large、turbo)から選択できます。このインストールのデフォルトは turbo です。モデルは初回ダウンロード後、~/.cache/whisper にキャッシュされます。
録音した .mp3 または .m4a ファイルを Openai Whisper に --model medium --output_format txt オプションを指定してドロップするだけで、機密性の高い会話をサードパーティのサービスにアップロードすることなく、きれいなテキストの文字起こしを取得できます。
--output_format srt を使用することで、動画編集ソフトやメディアプレイヤーにインポートできる字幕ファイルを生成できます。ローカル環境で録画に字幕を付けたいコンテンツクリエイターに最適です。
外国語の音声に対して --task translate を実行することで、1ステップで英語のトランスクリプトを取得できます。多言語のソース素材を扱う研究者やジャーナリストに役立ちます。
npx clawhub@latest install openai-whisperレビューを書くにはログイン
まだレビューはありません。最初の体験をシェアしましょう!