메모리 점유율
프로그램이나 모델이 실행되는 동안 메인 메모리(RAM) 또는 GPU 메모리에서 차지하는 공간의 양이다. 메모리 점유율이 낮을수록 더 저렴한 하드웨어에서 실행 가능하며, 동시에 더 많은 요청을 처리할 수 있다.