본문으로 건너뛰기

quantization-aware-training

양자화 인식 학습

고급

모델을 낮은 정밀도(예: int8)로 변환할 때 발생하는 성능 저하를 최소화하기 위해, 학습 단계에서 양자화 오차를 미리 반영하여 학습하는 기법이다.