세션 어피니티
특정 사용자의 요청을 이전에 처리했던 동일한 서버 인스턴스로 지속적으로 할당하는 기술이다. LLM 환경에서는 캐시된 데이터를 보유한 인스턴스에 접근하게 하여 캐시 히트율을 높이는 데 필수적이다.