무그라디언트 학습
함수의 기울기(Gradient) 정보를 사용하지 않고 최적의 가중치를 찾아가는 학습 방식이다. 역전파가 불가능한 불연속적인 환경이나 미분 불가능한 손실 함수를 가진 시스템에서 주로 사용된다.
미분 없이 학습 가능할까? 스칼라 보상만으로 신경망 훈련 성공