요청 기아
특정 프로세스나 요청이 우선순위에서 밀려 필요한 자원을 할당받지 못하고 무한정 대기하게 되는 상태를 의미한다.
vLLM 성능 저하의 주범, 노이지 네이버 문제를 해결하는 트래픽 제어 게이트웨이