지능형 라우팅
입력된 쿼리의 복잡도나 의도를 실시간으로 분석하여 가장 적합한 모델로 요청을 배분하는 기술이다. 단순한 질문은 저렴하고 빠른 모델로, 복잡한 추론은 고성능 모델로 보내 효율성을 극대화한다.