모델 압축
AI 모델의 크기를 줄여 적은 메모리와 연산량으로도 실행 가능하게 만드는 기법이다. 양자화 등을 통해 가중치를 낮은 정밀도로 변환하며, 온디바이스 배포와 추론 비용 절감에 필수적이다.