지속적 KV 캐시
트랜스포머 모델의 추론 과정에서 이전 프레임들의 키(Key)와 값(Value) 연산 결과를 메모리에 저장해두는 기술입니다. 매 프레임마다 전체 시퀀스를 다시 계산할 필요가 없으므로 연산 효율성을 극대화하여 실시간 비디오 처리를 가능하게 합니다.