응답 캐싱
동일 프롬프트나 동일 컨텍스트 요청에 대해 Redis 같은 외부 캐시를 사용해 응답을 저장하고 TTL과 키 전략으로 재사용률을 높여 API 호출과 비용을 줄이는 기법이며, 캐시 히트율과 일관성 정책이 설계 포인트다.