라우팅 가중치
입력 데이터가 여러 개의 전문가(LoRA) 중 어느 것에 얼마나 비중을 두어 전달될지를 결정하는 수치이다. 기존에는 학습을 통해 이 수치를 결정했으나 불균형 문제가 발생하곤 했다.