컨텍스트 창 확장
모델의 입력 토큰 한계를 직접 늘리지 않고 검색 계층에서 필요한 도구 및 설명을 선별해 제공함으로써 사실상 수천 개 능력을 활용하는 방식이다. 모델 입력의 비대화를 막아 지연과 비용을 제어하는 데 목적이 있다.