파이프라인 병렬화
대형 모델을 여러 GPU에 걸쳐 층 단위로 나눠 병렬로 실행하는 구성으로, 각 GPU가 특정 레이어 블록을 실행하고 결과를 다음 노드로 전달해 전체 실행 시간을 단축한다.