드롭인 프록시
기존 에이전트의 base_url만 교체하면 별도 코드 수정을 필요로 하지 않고 메모리 로딩을 가로채 토큰 예산 기반 응답을 반환하는 중간 계층으로 동작한다. 입력 요청을 가로채 내부적으로 recall을 호출하고, 처리된 결과를 원래 엔드포인트 형태로 재구성해 반환한다. 이 방식은 운영 중인 에이전트에 최소한의 변경으로 효율화를 적용할 수 있게 한다.