계층 7 로드 밸런서
OSI 7계층인 애플리케이션 계층에서 동작하며 HTTP 헤더나 본문 데이터를 분석해 부하를 분산하는 장치이다. LLM 환경에서는 요청의 토큰 수와 같은 구체적인 계산 부하를 파악하여 서버에 할당할 수 있어 효율적인 자원 관리가 가능하다.