캐시 읽기
이전에 저장된 응답·문맥을 검색해 재사용하는 동작으로, 입력 요청 → 캐시 조회 → 결과 반환의 흐름으로 작동한다. 재계산을 줄여 지연을 낮출 수 있으나 토큰으로 집계되어 비용에 반영된다.