토큰 캐싱
이전에 처리된 프롬프트의 일부를 저장해두고 재사용하는 기술이다. Claude 모델에서 반복적인 컨텍스트 입력 시 비용을 절감하고 응답 속도를 높이는 핵심 메커니즘이다.
"API로 썼으면 15달러?" Claude Code 사용량을 시각화하는 대시보드