그래디언트 노름
손실 함수에 대한 가중치의 기울기 크기를 나타내는 수치이다. 학습 과정에서 가중치가 얼마나 크게 업데이트되는지를 측정하며 이 값이 너무 크거나 작으면 학습이 불안정해지거나 멈출 수 있다.