토큰 할당
제한된 AI 모델의 처리 용량(토큰)을 특정 작업이나 더 강력한 모델의 호출에 전략적으로 배분하는 방식이다. 효율적인 자원 관리를 통해 복잡한 문제 해결 시에만 고성능 모델을 호출함으로써 성능과 비용의 균형을 맞춘다.