Design & Media🌊

songsee

Name: songsee
Author: OpenClaw

Genera espectrogramas y visualizaciones de audio multipanel desde la línea de comandos usando el CLI de songsee.

por OpenClawv1.0.0

Conectando a tu agente...

npx clawhub@latest install songsee

19Instalaciones actuales

v1.0.0Versión

Requisitos

songsee

Descripción del skill songsee

songsee es una herramienta de línea de comandos que convierte archivos de audio en espectrogramas y visualizaciones de paneles de características enriquecidas. Admite una amplia variedad de paneles de análisis acústico — desde espectrogramas mel y croma hasta MFCC, tempograma y sonoridad — y los exporta como archivos de imagen. Ya sea que necesites un espectrograma rápido de un solo panel o una cuadrícula completa de múltiples paneles para un análisis de audio en profundidad, songsee lo resuelve con un único comando.

Cómo usarlo

Step 1: Ejecuta en tu terminal o instala este skill en AgentCellar

npx clawhub@latest install songsee

Haz clic en el botón Instalar en la parte superior de esta página para una configuración rápida

When to Use songsee

Best Fit

Quieres una forma rápida y scriptable de generar imágenes de espectrogramas a partir de archivos MP3 o WAV sin escribir código.
Necesitas visualizaciones de características de audio en múltiples paneles (mel, chroma, HPSS, tempograma, MFCC, etc.) para análisis musical, investigación o depuración.
Quieres inspeccionar un segmento de tiempo específico de un archivo de audio largo proporcionando las opciones --start y --duration.
Estás construyendo un pipeline que envía audio a través de stdin y espera un archivo de imagen como salida.

When Not to Use

Necesitas visualización de audio en tiempo real o interactiva — songsee es una herramienta CLI por lotes que genera archivos de imagen estáticos.
Necesitas acceso programático a datos de características sin procesar (por ejemplo, arrays de numpy o JSON) en lugar de imágenes renderizadas.

Características principales

Visualizaciones de características en múltiples paneles

Renderiza múltiples paneles de análisis acústico en una sola imagen de cuadrícula usando --viz con una lista separada por comas. Los paneles compatibles incluyen spectrogram, mel, chroma, hpss, selfsim, loudness, tempogram, mfcc y flux.

Extracción de segmento temporal

Enfócate en cualquier segmento de un archivo de audio usando las opciones --start y --duration. Esto es útil para inspeccionar momentos específicos en grabaciones largas sin necesidad de editar el archivo previamente.

Modos de entrada flexibles

Acepta archivos de audio directamente o a través de stdin (cat track.mp3 | songsee -), lo que facilita su integración en pipelines de shell. Los formatos WAV y MP3 se decodifican de forma nativa; otros formatos se gestionan mediante ffmpeg si está disponible.

Estilo y control de salida

Elige entre múltiples paletas de colores (classic, magma, inferno, viridis, gray) y controla las dimensiones de salida con --width / --height. El formato de salida puede ser jpg o png.

FFT y Ajuste de Frecuencia

Ajusta con precisión el análisis con --window y --hop para la configuración de FFT, y --min-freq / --max-freq para limitar el rango de frecuencias mostrado.

Casos de uso

Preguntas y respuestas sobre producción musical

Los productores pueden ejecutar songsee track.mp3 para generar instantáneamente un espectrograma de una mezcla, inspeccionando visualmente el balance de frecuencias, el recorte o el ruido antes de exportar.

Investigación de Audio y Análisis de Características

Los investigadores pueden generar una visualización completa de 9 paneles que cubre mel, chroma, HPSS, tempograma, MFCC y más en un solo comando, proporcionando una huella acústica integral de una grabación.

Informes Automatizados de Pipelines de Audio

Utilizando el soporte de stdin, songsee puede integrarse en pipelines de CI o procesamiento por lotes para generar automáticamente miniaturas de espectrogramas o imágenes de diagnóstico para conjuntos de datos de audio.

Inspección de Segmento Específico

Los ingenieros de audio pueden usar --start y --duration para aislar y visualizar una sección específica de una pista — como el primer estribillo o un artefacto sospechoso — sin modificar el archivo fuente.

Conectando a tu agente...

npx clawhub@latest install songsee

19Instalaciones actuales

v1.0.0Versión

Requisitos

songsee

Preguntas frecuentes

Reseñas

0 reseñas

Inicia sesión para escribir una reseña

Aún no hay reseñas. ¡Sé el primero en compartir tu experiencia!