하드웨어 활용률
GPU나 TPU 같은 연산 자원이 전체 용량 대비 실제로 얼마나 사용되고 있는지를 나타내는 지표입니다. LLM 추론 시 메모리 대역폭이나 연산 유닛을 최대한 활용하여 비용 대비 성능을 극대화하는 것이 중요합니다.