PCIe 병목 현상
GPU 간 또는 GPU와 CPU 간의 데이터 전송 통로인 PCIe 대역폭이 모델 연산 속도를 따라가지 못해 발생하는 성능 저하 현상이다. 특히 NVLink가 제거된 소비자용 GPU에서 대규모 모델을 분산 처리할 때 전송 속도가 수십 GB/s 수준으로 제한되어 전체 추론 속도를 늦추는 주요 원인이 된다.