요약
긴 대화 내용을 핵심 위주로 압축하여 LLM에 전달하는 기법이다. 토큰을 절약하면서도 대화의 전체적인 맥락을 유지할 수 있게 해주지만, 요약을 위한 추가적인 LLM 호출 비용이 발생한다.