양자화 인식 학습(quantization-aware-training)이란 무엇인가요?

Question

Accepted Answer

모델을 낮은 정밀도(예: int8)로 변환할 때 발생하는 성능 저하를 최소화하기 위해, 학습 단계에서 양자화 오차를 미리 반영하여 학습하는 기법이다.

quantization-aware-training