GPU 가상 머신
GPU 가속기가 장착된 가상 머신으로 사용자가 OS, 드라이버, 런타임을 직접 관리해야 한다. 세밀한 제어가 가능하지만 유휴 상태에서도 비용이 발생한다.
Docker와 CUDA 설정 없이 LLM 배포? 서버리스 GPU의 실체