AMD 추론 마이크로서비스
AMD Inference Microservices의 약자로, AMD Instinct GPU 환경에서 LLM 추론을 최적화하여 실행하기 위한 마이크로서비스 아키텍처 기반의 배포 단위이다. 컨테이너화된 형태로 제공되어 쿠버네티스 환경에서 확장이 용이하며 고성능 추론을 지원한다.