셔플
분산 컴퓨팅 환경에서 데이터를 재그룹화하기 위해 여러 노드 간에 데이터를 전송하고 재배치하는 과정이다. 네트워크 비용과 디스크 I/O가 발생하여 스트리밍 시스템의 지연 시간에 큰 영향을 미친다.