컨텍스트 예산 관리
LLM이 한 번에 처리할 수 있는 토큰 제한 내에서 가장 관련성 높은 정보만 효율적으로 배치하는 기술이다. 비용을 절감하고 모델이 핵심 정보에 집중하게 하여 답변의 품질을 최적화하는 데 중요하다.