시간 스트레칭
오디오 신호의 음높이(Pitch)를 유지하면서 재생 속도만 변경하는 오디오 증강 기법이다. 모델이 다양한 속도의 음성이나 소리를 인식할 수 있도록 돕는다. librosa와 같은 라이브러리를 통해 구현하며 오디오 데이터의 시간적 변동성에 대한 강건성을 높인다.
데이터 부족과 과적합 해결의 열쇠, 데이터 증강 기법 총정리