프리페칭
실제로 연산에 필요하기 전에 데이터를 미리 메모리로 로드하는 최적화 기술이다. MoE 추론에서는 다음에 활성화될 전문가를 예측하여 미리 준비함으로써 데이터 전송 대기 시간을 최소화한다.