음성 인식 환각
음성 인식(ASR) 모델이 실제 오디오에는 없는 단어를 생성하거나, 무음 또는 노이즈 구간에서 무의미한 텍스트를 반복적으로 출력하는 현상이다. 이는 학습 데이터의 품질을 저하시키는 주요 원인이 된다.