VRAM 오프로딩
GPU의 전용 메모리(VRAM)가 부족할 때 상대적으로 느리지만 용량이 큰 시스템 RAM이나 SSD로 데이터를 옮겨 처리하는 기술이다. 이를 통해 물리적 한계를 넘는 대규모 모델을 실행할 수 있으나 데이터 전송 속도 차이로 인해 성능 저하가 발생할 수 있다.