본문으로 건너뛰기
LLM 추론 효율을 극대화하는 프레임워크 캐싱(Prefix Caching)의 원리와 활용 | AI Trends