L2 노름
벡터의 각 요소의 제곱합에 루트를 씌운 값으로, 가중치 행렬의 크기를 측정하는 표준적인 방법이다. 이 값을 일정 수준 이하로 제한함으로써 모델의 과적합을 방지하고 일반화 성능을 유도한다.