GPU 사용률
GPU 자원이 실제로 연산에 활용되고 있는 비율이다. 배치 추론 시 CPU에서 수행되는 전처리 속도가 느리면 GPU가 연산을 멈추고 대기하는 유휴 상태가 발생하여 비용 효율성이 저하된다.