스트래글러
분산 컴퓨팅 환경에서 다른 노드들보다 유독 느리게 실행되어 전체 작업의 완료 시간을 지연시키는 특정 노드나 프로세스를 의미한다.
PyTorch 학습이 왜 느릴까? TraceML로 실시간 병목 지점 완벽 분석