auto-compact
자동 요약
대화 이력이 길어져 모델의 컨텍스트 윈도우 한계에 도달할 때, 이전 대화 내용을 핵심 위주로 요약하여 토큰 사용량을 관리하는 기법이다. 중요한 정보는 보존하면서 불필요한 세부 사항을 제거하여 긴 세션에서도 모델의 추론 성능을 유지한다. 사용자가 수동으로 관리하지 않아도 지속적인 작업이 가능하도록 돕는 기능이다.
자동 요약
대화 이력이 길어져 모델의 컨텍스트 윈도우 한계에 도달할 때, 이전 대화 내용을 핵심 위주로 요약하여 토큰 사용량을 관리하는 기법이다. 중요한 정보는 보존하면서 불필요한 세부 사항을 제거하여 긴 세션에서도 모델의 추론 성능을 유지한다. 사용자가 수동으로 관리하지 않아도 지속적인 작업이 가능하도록 돕는 기능이다.