하이브리드 라우팅
사용자의 요청 난이도나 유형에 따라 서로 다른 성능과 가격의 모델로 작업을 분산하는 전략이다. 단순한 작업은 저렴한 모델로, 복잡한 추론은 고성능 모델로 보내 비용과 품질의 균형을 맞춘다.