모델 캐스케이드
입력된 쿼리의 복잡도를 분석하여 단순한 작업은 저렴한 소형 모델로, 복잡한 작업은 고성능 모델로 자동 분산시키는 전략이다. 이를 통해 전체 시스템의 성능은 유지하면서 운영 비용을 최적화할 수 있다.