음향 편향 현상
음성 생성 모델이 학습 과정에서 원래의 자연스러운 음성 분포를 벗어나 기계적이거나 부자연스러운 소리를 내게 되는 현상이다. 텍스트 정보에만 치중한 최적화가 진행될 때 음성 품질이 저하되는 원인이 된다.