그래디언트 할인
역전파 과정에서 발생하는 그래디언트의 크기를 특정 계수를 통해 조절하여 학습의 안정성을 도모하는 기법이다. 특히 여러 단계를 거치며 증폭된 그래디언트 성분을 완전히 제거하는 대신 적절히 줄여줌으로써 유용한 학습 신호를 보존하면서도 수치적 불안정성을 해결한다.