inference-cloud
AI 모델의 학습이 아닌, 학습된 모델을 실제로 실행하여 결과를 도출하는 '추론' 작업에 최적화된 클라우드 인프라이다. 대규모 사용자 요청을 실시간으로 처리하기 위해 고대역폭 메모리와 효율적인 연산 장치를 갖추는 것이 특징이다.
AI 모델의 학습이 아닌, 학습된 모델을 실제로 실행하여 결과를 도출하는 '추론' 작업에 최적화된 클라우드 인프라이다. 대규모 사용자 요청을 실시간으로 처리하기 위해 고대역폭 메모리와 효율적인 연산 장치를 갖추는 것이 특징이다.