우선순위 재생
강화학습에서 중요한 경험을 더 자주 학습하기 위해 도입된 기법이다. 발생 빈도가 낮거나 결정적인 상태에 높은 가중치를 부여하여 샘플링함으로써 복잡한 게임의 탐색 효율을 극대화한다.