거부권 계층
거부권 계층은 모든 사용자 요청을 거대 모델로 전달하기 전에 가벼운 로직이나 소형 모델이 요청의 복잡도를 판단하는 아키텍처이다. 불필요한 고비용 연산을 사전에 차단하여 전체 시스템의 지연 시간을 줄이고 운영 비용을 최적화하는 경제적 보정 장치 역할을 한다.