본문으로 건너뛰기
AI Trends
피드
트렌딩
콜로세움
공지
로그인
피드
트렌딩
콜로세움
공지
캐시 활용률 (cache-utilization) 용어 설명 | AI Trends
cache-utilization
캐시 활용률
중급
LLM 요청 시 이전에 생성된 결과를 재사용하는 비율을 의미한다. 높은 캐시 활용률은 API 호출 비용을 절감하고 응답 지연 시간을 획기적으로 줄이는 데 기여한다.
비슷한 개념
llm-caching
cache-hit-rate
semantic-cache
prompt-caching
lru-cache
token-efficiency
memoization
latency
← 용어 사전 전체 보기