npx clawhub@latest install songsee요구 사항
songsee는 오디오 파일을 스펙트로그램 및 다양한 특성 패널 시각화로 변환하는 커맨드라인 도구입니다. 멜 스펙트로그램과 크로마부터 MFCC, 템포그램, 음량에 이르기까지 폭넓은 음향 분석 패널을 지원하며, 결과물을 이미지 파일로 출력합니다. 단일 패널 스펙트로그램이 빠르게 필요하든, 심층 오디오 분석을 위한 멀티 패널 그리드가 필요하든, songsee는 단 하나의 명령어로 모든 것을 처리합니다.
npx clawhub@latest install songsee이 페이지 상단의 설치 버튼을 클릭하면 원클릭으로 설정할 수 있습니다
--start 및 --duration 플래그를 제공하여 긴 오디오 파일의 특정 시간 구간을 검사하고 싶을 때.--viz와 쉼표로 구분된 목록을 사용하여 여러 음향 분석 패널을 단일 그리드 이미지로 렌더링합니다. 지원되는 패널에는 spectrogram, mel, chroma, hpss, selfsim, loudness, tempogram, mfcc, flux가 포함됩니다.
--start 및 --duration 플래그를 사용하여 오디오 파일의 특정 구간에 집중하세요. 이 기능은 파일을 미리 편집하지 않고도 긴 녹음에서 특정 순간을 검토하는 데 유용합니다.
오디오 파일을 직접 또는 stdin을 통해 입력받을 수 있으며 (cat track.mp3 | songsee -), 셸 파이프라인에 쉽게 통합할 수 있습니다. WAV 및 MP3는 기본적으로 디코딩되며, 다른 형식은 ffmpeg가 설치되어 있을 경우 이를 통해 처리됩니다.
여러 색상 팔레트(classic, magma, inferno, viridis, gray) 중에서 선택하고 --width / --height로 출력 크기를 제어하세요. 출력 형식은 jpg 또는 png로 설정할 수 있습니다.
--window 및 --hop으로 FFT 설정을 세부 조정하고, --min-freq / --max-freq로 표시되는 주파수 범위를 제한하세요.
프로듀서는 songsee track.mp3를 실행하여 믹스의 스펙트로그램을 즉시 생성하고, 내보내기 전에 주파수 균형, 클리핑 또는 노이즈를 시각적으로 검사할 수 있습니다.
연구자들은 하나의 명령으로 mel, chroma, HPSS, tempogram, MFCC 등을 포함한 완전한 9패널 시각화를 생성할 수 있으며, 이를 통해 녹음의 포괄적인 음향 지문을 제공합니다.
stdin 지원을 활용하여, songsee는 CI 또는 배치 처리 파이프라인에 임베드되어 오디오 데이터셋에 대한 스펙트로그램 썸네일 또는 진단 이미지를 자동으로 생성할 수 있습니다.
오디오 엔지니어는 --start와 --duration을 사용하여 소스 파일을 편집하지 않고도 트랙의 특정 구간(예: 첫 번째 코러스나 아티팩트가 의심되는 부분)을 분리하여 시각화할 수 있습니다.
npx clawhub@latest install songsee요구 사항
리뷰를 작성하려면 로그인
아직 리뷰가 없습니다. 첫 번째로 경험을 공유해 보세요!