중요도 샘플링 가중치
PER 사용 시 특정 샘플이 자주 뽑히면서 발생하는 데이터 분포의 편향을 보정하기 위해 업데이트 크기를 조절하는 기술이다. 편향을 줄여주지만 동시에 그래디언트 업데이트 강도를 억제하는 부작용이 있을 수 있다.