계단식 강화학습
도메인별로 순차적인 강화학습을 진행하여 특정 분야의 성능을 고도화하는 기법이다. 하이퍼파라미터를 도메인에 맞게 개별 최적화하면서도 이전 학습 내용이 사라지는 파괴적 망각을 방지한다.