캐시 제거
제한된 메모리 용량 내에서 성능을 유지하기 위해 중요도가 낮은 캐시 데이터를 선별하여 삭제하는 관리 기법입니다. LLM에서는 문맥 이해에 기여도가 낮은 토큰의 KV 쌍을 제거하여 효율을 높입니다.