이중 KV 캐시
영상 입력을 처리하는 캐시와 텍스트 답변을 생성하는 캐시를 분리하여 관리하는 기술이다. 이를 통해 영상 수신과 답변 생성을 동시에 병렬로 수행할 수 있어 스트리밍 환경에서의 실시간성을 보장한다.