모델 서버
모델 서버는 모델을 별도의 프로세스나 네트워크 서비스로 배포하여 외부 클라이언트가 HTTP나 RPC로 요청을 보내어 추론을 수행하는 아키텍처이다. 입력을 수신하면 토큰화·전처리·추론·후처리 과정을 거쳐 응답을 반환하며, 확장성과 격리성이 필요할 때 주로 사용된다. 이 글 맥락에서는 모델 서버를 별도로 띄우지 않고 라이브러리 내에서 직접 모델 호출을 수행하는 대안과 대비되는 개념이다.