본문으로 건너뛰기

fisher-norm

피셔 노름

고급

확률 분포의 변화량을 측정하는 척도로, 강화학습에서는 정책 업데이트 시 발생하는 학습 신호의 강도를 의미한다. 이 값이 클수록 모델이 해당 샘플로부터 더 많은 정보를 얻어 가중치를 효과적으로 갱신할 수 있다.