캐시 쓰기
새로운 응답·문맥을 캐시에 저장하는 동작으로, 모델 출력 이후 해당 결과와 메타데이터를 저장한다. 쓰기 빈도가 높으면 재사용 가능성은 올라가지만 저장된 토큰량 때문에 비용이 증가할 수 있다.