추론 최적화 클라우드
모델 학습이 아닌 실제 서비스 단계의 추론(Inference) 작업에 특화된 클라우드 인프라이다. 낮은 지연 시간과 높은 비용 효율성을 목표로 하며 운영 비용 절감에 필수적이다.