프루닝
신경망 모델에서 성능에 기여도가 낮은 가중치나 레이어를 제거하여 모델의 크기를 줄이고 속도를 높이는 최적화 기법이다. 모델 증류와 결합하여 성능 손실을 최소화하면서 모델을 경량화하는 데 주로 사용된다.