모델 프루닝
신경망에서 성능에 기여도가 낮은 가중치나 뉴런을 제거하여 모델의 크기를 줄이는 최적화 기법이다. 연산 효율성을 높이고 메모리 사용량을 줄여 온디바이스 환경 배포에 필수적이다.