npx clawhub@latest install songsee系統需求
songsee 是一款命令列工具,可將音訊檔案轉換為頻譜圖與豐富的特徵面板視覺化圖表。它支援多種聲學分析面板——從梅爾頻譜圖、色度圖,到 MFCC、節拍圖與響度——並以圖片檔案形式輸出。無論您需要快速產生單一面板的頻譜圖,還是用於深度音訊分析的完整多面板網格,songsee 皆可透過單一指令完成。
npx clawhub@latest install songsee點擊本頁頂部的 安裝 按鈕即可一鍵設定
--start 和 --duration 旗標,檢視一段長音訊檔案中的特定時間片段。使用 --viz 搭配以逗號分隔的清單,在單一網格圖像中渲染多個聲學分析面板。支援的面板包括 spectrogram、mel、chroma、hpss、selfsim、loudness、tempogram、mfcc 以及 flux。
使用 --start 與 --duration 旗標,專注於音訊檔案的任意片段。這對於在不預先編輯檔案的情況下,檢視長時間錄音中的特定時刻非常實用。
直接接受音訊檔案或透過 stdin 輸入(cat track.mp3 | songsee -),讓整合進 shell 管線變得輕鬆簡便。WAV 與 MP3 格式可原生解碼;其他格式則在 ffmpeg 可用的情況下透過其處理。
從多種色彩調色盤中選擇(classic、magma、inferno、viridis、gray),並使用 --width / --height 控制輸出尺寸。輸出格式可選擇 jpg 或 png。
使用 --window 和 --hop 微調 FFT 設定,並透過 --min-freq / --max-freq 限制顯示的頻率範圍。
製作人可以執行 songsee track.mp3,即時生成混音的頻譜圖,在匯出前以視覺方式檢查頻率平衡、削波或噪音等問題。
研究人員只需一個指令,即可生成涵蓋 mel 頻譜、色度圖、HPSS、節拍圖、MFCC 等內容的完整 9 格視覺化圖表,為錄音提供全面的聲學指紋分析。
透過標準輸入(stdin)支援,songsee 可嵌入 CI 或批次處理管道中,自動為音訊資料集生成頻譜圖縮圖或診斷影像。
音訊工程師可以使用 --start 和 --duration 來隔離並視覺化音軌中的特定區段——例如第一段副歌或疑似出現雜訊的部分——而無需編輯原始檔案。
npx clawhub@latest install songsee系統需求
登入後撰寫評價
尚無評價。來分享你的使用體驗吧!