멜-스펙트로그램
소리의 주파수 성분을 인간의 청각 특성에 맞춰 변환한 시각적 표현 방식이다. 오디오 신호를 시간과 주파수 축으로 시각화하여 CNN 모델이 이미지처럼 학습할 수 있게 하며, AI 음악 탐지에서 핵심적인 입력 데이터로 쓰인다.