추론 최적화 클라우드
모델 학습이 아닌 실제 서비스 단계의 추론(Inference) 작업에 특화된 클라우드 인프라이다. 낮은 지연 시간과 높은 비용 효율성을 목표로 하며 운영 비용 절감에 필수적이다.
7,000억 달러 규모의 AI 인프라 전쟁, 누가 어떻게 돈을 대는가?