병합
여러 개의 모델 가중치나 전문가를 하나로 합쳐 파라미터 수를 줄이는 기법이다. 정보를 완전히 삭제하는 Pruning과 달리 유사한 전문가들을 결합하여 원래의 지식을 최대한 보존하려는 목적을 가진다.