L2 시프트
가중치 벡터 간의 유클리드 거리를 기준으로 한 변화량을 의미한다. 모델 병합 과정에서 원래 모델의 가중치가 얼마나 변형되었는지 수치화하는 데 사용된다.
14B 모델의 스위트 스팟: SOLAR와 Granite의 추론 능력을 결합하다