우선순위 경험 재생
학습 효율을 높이기 위해 과거의 경험 중 예상치 못한 결과나 중요한 샘플에 더 높은 우선순위를 두어 학습에 활용하는 기법이다.
DQN부터 PPO까지, 직접 만든 RL 토이 게임 5종 세트