정책 환생
기존에 학습된 모델의 지식이나 가중치를 새로운 학습 단계의 초기값으로 사용하여 학습 효율을 극대화하는 전략이다. 본 논문에서는 Pre-train Space에서 학습된 모델을 Post-train Space 학습의 시작점으로 활용한다.