라우팅 레이어
사용자의 요청을 분석하여 가장 적합한 처리 모델로 전달하는 중간 소프트웨어 계층이다. 여러 LLM 구독 서비스 중 작업 성격에 맞는 모델을 선택해 리소스 낭비를 줄이고 효율을 높이는 데 중요하다.