Delta-Space Weight Merge
∆-Space Weight Merge(DSWM)는 distillation에서의 가중치 변화(∆Wdistill)와 정렬/학습에서의 가중치 변화(∆WAlign)를 선형적으로 더해(Wbase + ∆Wdistill + ∆WAlign) 분해된 출력 변화를 상호 간섭 없이 결합하는 방법이다.