토큰 사용 최적화
API 호출 시 발생하는 비용과 모델의 컨텍스트 제한을 관리하기 위해 입력 및 출력 텍스트의 양을 전략적으로 조절하는 행위이다. 효율적인 프롬프트 설계나 데이터 압축 기술을 포함한다.