컨텍스트 슬리밍
LLM에 입력되는 불필요한 데이터를 제거하여 토큰 사용량을 줄이는 기법이다. 핵심 정보만 남기고 세부 사항은 외부 검색 도구로 분리하여 모델의 추론 집중도와 비용 효율성을 높인다.