메모리 인지 기반 축출
GPU 메모리 상태를 실시간으로 감시하여 사용 빈도가 낮거나 우선순위가 낮은 모델을 메모리에서 제거하는 전략이다. 제한된 하드웨어 자원에서 여러 모델을 효율적으로 운영하기 위해 필수적이다.