광역 전문가 병렬 처리
MoE 모델의 전문가 레이어를 수십 개 이상의 많은 GPU에 걸쳐 분산 배치하는 서빙 패턴이다. KV 캐시 용량을 확보하고 배치 크기를 키울 수 있어 대규모 sparse 모델 서빙의 표준으로 자리 잡고 있다.