랭크 불균형
분산 학습 환경에서 특정 GPU 노드의 작업 처리가 늦어져 전체 시스템의 속도가 가장 느린 노드에 맞춰지는 현상이다. 이를 해결하기 위해 각 랭크별 소요 시간 모니터링이 필요하다.