Genera espectrogramas y visualizaciones de audio multipanel desde la línea de comandos usando el CLI de songsee.
npx clawhub@latest install songseeRequisitos
songsee es una herramienta de línea de comandos que convierte archivos de audio en espectrogramas y visualizaciones de paneles de características enriquecidas. Admite una amplia variedad de paneles de análisis acústico — desde espectrogramas mel y croma hasta MFCC, tempograma y sonoridad — y los exporta como archivos de imagen. Ya sea que necesites un espectrograma rápido de un solo panel o una cuadrícula completa de múltiples paneles para un análisis de audio en profundidad, songsee lo resuelve con un único comando.
npx clawhub@latest install songseeHaz clic en el botón Instalar en la parte superior de esta página para una configuración rápida
--start y --duration.Renderiza múltiples paneles de análisis acústico en una sola imagen de cuadrícula usando --viz con una lista separada por comas. Los paneles compatibles incluyen spectrogram, mel, chroma, hpss, selfsim, loudness, tempogram, mfcc y flux.
Enfócate en cualquier segmento de un archivo de audio usando las opciones --start y --duration. Esto es útil para inspeccionar momentos específicos en grabaciones largas sin necesidad de editar el archivo previamente.
Acepta archivos de audio directamente o a través de stdin (cat track.mp3 | songsee -), lo que facilita su integración en pipelines de shell. Los formatos WAV y MP3 se decodifican de forma nativa; otros formatos se gestionan mediante ffmpeg si está disponible.
Elige entre múltiples paletas de colores (classic, magma, inferno, viridis, gray) y controla las dimensiones de salida con --width / --height. El formato de salida puede ser jpg o png.
Ajusta con precisión el análisis con --window y --hop para la configuración de FFT, y --min-freq / --max-freq para limitar el rango de frecuencias mostrado.
Los productores pueden ejecutar songsee track.mp3 para generar instantáneamente un espectrograma de una mezcla, inspeccionando visualmente el balance de frecuencias, el recorte o el ruido antes de exportar.
Los investigadores pueden generar una visualización completa de 9 paneles que cubre mel, chroma, HPSS, tempograma, MFCC y más en un solo comando, proporcionando una huella acústica integral de una grabación.
Utilizando el soporte de stdin, songsee puede integrarse en pipelines de CI o procesamiento por lotes para generar automáticamente miniaturas de espectrogramas o imágenes de diagnóstico para conjuntos de datos de audio.
Los ingenieros de audio pueden usar --start y --duration para aislar y visualizar una sección específica de una pista — como el primer estribillo o un artefacto sospechoso — sin modificar el archivo fuente.
npx clawhub@latest install songseeRequisitos
Inicia sesión para escribir una reseña
Aún no hay reseñas. ¡Sé el primero en compartir tu experiencia!