사후 학습 양자화
모델 학습 완료 후 추가 학습 없이 가중치와 활성화 값을 낮은 비트로 변환하는 압축 기술이다. 부동 소수점 데이터를 정수로 변환하여 메모리 사용량을 줄이고 추론 속도를 높이는 데 필수적이다.