긴 컨텍스트 압축
방대한 양의 입력 데이터(예: 128K 토큰)를 재사용 가능한 메모리 스냅샷 형태로 압축하여 저장하는 기술이다. 동일한 컨텍스트를 반복해서 처리할 때 발생하는 연산 비용을 최대 90%까지 절감하고 추론 속도를 높이는 효과가 있다.