보정 데이터
양자화 과정에서 모델의 성능 저하를 막기 위해 사용하는 샘플 데이터셋이다. 모델이 실제 텍스트를 처리하는 방식을 모방하여 가중치 분포를 최적화하고 정보 손실을 최소화하는 기준점으로 활용된다.