입실론 감쇠
강화학습의 탐험(Exploration)과 이용(Exploitation) 균형을 조절하는 기법이다. 학습 초기에는 무작위 행동(입실론) 확률을 높게 유지하여 환경을 충분히 탐색하게 하고, 학습이 진행됨에 따라 이 확률을 점진적으로 줄여 학습된 지식을 활용하도록 유도한다.