Générez des spectrogrammes et des visualisations audio multi-panneaux depuis la ligne de commande en utilisant le CLI songsee.
npx clawhub@latest install songseePrérequis
songsee est un outil en ligne de commande qui convertit des fichiers audio en spectrogrammes et en visualisations multi-panneaux de caractéristiques acoustiques. Il prend en charge une large gamme de panneaux d'analyse acoustique — des spectrogrammes mel et chroma aux MFCC, tempogramme et sonie — et les exporte sous forme de fichiers image. Que vous ayez besoin d'un spectrogramme rapide à panneau unique ou d'une grille multi-panneaux complète pour une analyse audio approfondie, songsee s'en charge en une seule commande.
npx clawhub@latest install songseeCliquez sur le bouton Installer en haut de cette page pour une configuration en un clic
--start et --duration.Affichez plusieurs panneaux d'analyse acoustique dans une seule image en grille en utilisant --viz avec une liste séparée par des virgules. Les panneaux pris en charge comprennent spectrogram, mel, chroma, hpss, selfsim, loudness, tempogram, mfcc et flux.
Concentrez-vous sur n'importe quel segment d'un fichier audio en utilisant les indicateurs --start et --duration. Cela est utile pour inspecter des moments spécifiques dans de longs enregistrements sans avoir à pré-éditer le fichier.
Accepte les fichiers audio directement ou via stdin (cat track.mp3 | songsee -), facilitant l'intégration dans des pipelines shell. Les formats WAV et MP3 sont décodés nativement ; les autres formats sont gérés via ffmpeg si disponible.
Choisissez parmi plusieurs palettes de couleurs (classic, magma, inferno, viridis, gray) et contrôlez les dimensions de sortie avec --width / --height. Le format de sortie peut être jpg ou png.
Affinez l'analyse avec --window et --hop pour les paramètres FFT, et --min-freq / --max-freq pour contraindre la plage de fréquences affichée.
Les producteurs peuvent exécuter songsee track.mp3 pour générer instantanément un spectrogramme d'un mixage, en inspectant visuellement l'équilibre des fréquences, l'écrêtage ou le bruit avant l'exportation.
Les chercheurs peuvent générer une visualisation complète en 9 panneaux couvrant mel, chroma, HPSS, tempogramme, MFCC et bien plus encore en une seule commande, fournissant une empreinte acoustique complète d'un enregistrement.
Grâce à la prise en charge de stdin, songsee peut être intégré dans des pipelines CI ou de traitement par lots pour générer automatiquement des miniatures de spectrogrammes ou des images de diagnostic pour des ensembles de données audio.
Les ingénieurs du son peuvent utiliser --start et --duration pour isoler et visualiser une section spécifique d'une piste — comme le premier refrain ou un artefact suspecté — sans modifier le fichier source.
npx clawhub@latest install songseePrérequis
Se connecter pour écrire un avis
Aucun avis pour l'instant. Soyez le premier à partager votre expérience !