혼합 전문가 라우팅
Mixture of Experts 모델에서 입력 토큰을 가장 적합한 전문가(Expert) 네트워크로 전달하는 과정이다. 각 토큰의 특징 벡터와 전문가들의 가중치를 비교하여 상위 K개의 전문가를 선택하는 연산이 핵심이다.