컨텍스트 압축
대화가 길어져 컨텍스트 창 한계에 도달할 때, 이전 내용을 자동으로 요약하여 중요한 맥락은 유지하면서 토큰 사용량을 줄이는 기술이다. 이를 통해 모델이 정보 유실 없이 더 긴 시간 동안 작업을 지속할 수 있게 한다.