서버 측 압축
긴 대화나 작업 과정에서 발생하는 방대한 컨텍스트 데이터를 서버에서 효율적으로 요약하거나 압축하여 모델의 컨텍스트 제한을 극복하고 비용을 절감하는 기술이다. 이를 통해 수 시간 동안 지속되는 에이전트 작업을 중단 없이 수행할 수 있다.