토큰 효율성
LLM 서비스 이용 시 발생하는 비용과 처리량의 척도인 토큰 사용량을 최소화하는 것을 의미한다. 불필요한 컨텍스트 주입이나 반복적인 호출을 줄임으로써 운영 비용을 절감하고 응답 속도를 개선할 수 있다.