저비디오램 모드
메모리 사용량을 최적화하여 사양이 낮은 GPU에서도 대규모 모델을 처리할 수 있게 하는 기술이다. 데이터를 한꺼번에 올리지 않고 순차적으로 처리하는 스트리밍 방식을 주로 사용한다.