토큰 감소
LLM이 텍스트를 처리하는 단위인 토큰의 수를 줄여 비용과 처리 시간을 최적화하는 과정이다. 토큰 수가 줄어들면 API 호출 비용이 직접적으로 절감된다.
거대 모델 필요 없다? 0.8B 모델로 코드 100개 파일 완벽 추론
코드 두 줄로 LLM 비용 40% 절감? 프롬프트 압축 API AgentReady