cold-start
실행 중인 인스턴스가 없는 상태에서 새로운 컨테이너를 띄우고 모델을 메모리에 로드하기까지 걸리는 지연 시간이다. 모델 크기가 클수록 이 시간이 길어져 사용자 경험을 해친다.
Qwen-32B 모델을 1.5초 만에 실행하는 GPU 스냅샷 기술
RTX 3080으로 돌려본 LTX-Video: 8단계만으로 백플립 영상 생성 가능할까?
40초의 기다림 vs 복잡한 DevOps, 서버리스 GPU 배포의 실전 선택지
2년치 데이터로 60개월 LTV 예측하기: SaaS 기업의 실전 ML 전략
8분 추론에 100분 과금? 서버리스 MLOps의 숨겨진 비용 함정