자동 요약
대화 이력이 길어져 모델의 컨텍스트 윈도우 한계에 도달할 때, 이전 대화 내용을 핵심 위주로 요약하여 토큰 사용량을 관리하는 기법이다. 중요한 정보는 보존하면서 불필요한 세부 사항을 제거하여 긴 세션에서도 모델의 추론 성능을 유지한다. 사용자가 수동으로 관리하지 않아도 지속적인 작업이 가능하도록 돕는 기능이다.