스래싱
가상 메모리 시스템에서 페이지 부재가 너무 자주 발생하여, 프로세스가 실제 연산을 수행하는 시간보다 페이지를 교체하는 데 더 많은 시간을 소비하는 현상이다. ML 파이프라인에서는 GPU 메모리 용량을 초과하는 데이터를 처리할 때 PCI-e 대역폭을 통한 데이터 이주가 반복되면서 전체 학습 및 추론 속도를 심각하게 저하시킨다.