CUDA 컨텍스트
GPU 연산을 수행하기 위해 필요한 모든 리소스와 상태 정보를 담고 있는 관리 컨테이너이다. 이를 생성하고 초기화하는 과정은 오버헤드가 크기 때문에 스냅샷에 포함하여 복원하는 것이 성능 향상의 핵심이다.
32B 모델을 1.5초 만에 깨우는 GPU 런타임 스냅샷 기술