INT8 양자화
부동소수점 가중치를 8비트 정수로 변환하여 모델 크기를 줄이고 추론 속도를 높이는 기법이다. 엣지 기기에서 효율적인 실행을 위해 필수적이지만 하드웨어 가속기 특성에 따라 정확도 손실이 발생할 수 있다.