캐시된 토큰
자주 반복되는 프롬프트나 컨텍스트 데이터를 메모리에 미리 저장하여 재사용하는 기술이다. 동일한 입력에 대해 연산량을 줄여 응답 속도를 높이고 API 비용을 절감하는 데 핵심적인 역할을 한다.