메모리 트래픽
프로세서와 메모리 사이에서 주고받는 데이터의 양을 의미한다. 딥러닝 추론 시 연산 능력보다 메모리 대역폭이 병목이 되는 경우가 많아, 이를 줄이는 것이 전체 시스템의 지연 시간을 단축하는 핵심 요소가 된다.