npx clawhub@latest install songsee動作要件
songsee は、音声ファイルをスペクトログラムやリッチなフィーチャーパネルの可視化に変換するコマンドラインツールです。メルスペクトログラムやクロマから、MFCC、テンポグラム、ラウドネスまで、幅広い音響解析パネルをサポートし、画像ファイルとして出力します。シンプルなシングルパネルのスペクトログラムが必要な場合でも、詳細な音声解析のためのフルマルチパネルグリッドが必要な場合でも、songsee はたった1つのコマンドで対応します。
npx clawhub@latest install songseeこのページ上部のインストールボタンをクリックするとワンクリックでセットアップできます
--start および --duration フラグを指定して、長い音声ファイルの特定の時間スライスを検査したい。--viz にカンマ区切りのリストを指定することで、複数の音響解析パネルを1つのグリッド画像としてレンダリングできます。対応しているパネルは、spectrogram、mel、chroma、hpss、selfsim、loudness、tempogram、mfcc、flux です。
--start フラグと --duration フラグを使用して、音声ファイルの任意のセグメントに焦点を当てます。これは、ファイルを事前に編集することなく、長い録音の特定の瞬間を検査するのに役立ちます。
オーディオファイルを直接、またはstdin経由(cat track.mp3 | songsee -)で受け付けるため、シェルパイプラインへの組み込みが簡単です。WAVおよびMP3はネイティブでデコードされ、その他のフォーマットはffmpegが利用可能な場合にそちらで処理されます。
複数のカラーパレット(classic、magma、inferno、viridis、gray)から選択し、--width / --height で出力サイズを制御できます。出力フォーマットは jpg または png を選択できます。
--window と --hop でFFT設定の分析を細かく調整し、--min-freq / --max-freq で表示する周波数範囲を制限します。
プロデューサーは songsee track.mp3 を実行することで、ミックスのスペクトログラムを瞬時に生成し、エクスポート前に周波数バランス、クリッピング、またはノイズを視覚的に確認することができます。
研究者は、mel、chroma、HPSS、テンポグラム、MFCCなどをカバーする完全な9パネルのビジュアライゼーションを1つのコマンドで生成でき、録音の包括的な音響フィンガープリントを提供します。
stdinサポートを活用することで、songseeはCIやバッチ処理パイプラインに組み込み、オーディオデータセットのスペクトログラムサムネイルや診断画像を自動生成することができます。
オーディオエンジニアは、--start と --duration を使用して、ソースファイルを編集することなく、最初のサビや疑わしいアーティファクトなど、トラックの特定のセクションを切り出して可視化することができます。
npx clawhub@latest install songsee動作要件
レビューを書くにはログイン
まだレビューはありません。最初の体験をシェアしましょう!