노르무온
AdamW의 대안으로, 매트릭스 형태의 파라미터에 대해 각 행별로 가중치를 정규화하고, per-neuron 균형을 맞추는 업데이트를 수행하는 최적화 알고리즘. 손실의 기울기 부호에 기반한 학습에서 안정성과 계산 효율을 도모한다.