티처 포싱
RNN이나 Transformer 학습 시 모델의 이전 출력이 아닌 실제 정답(Ground Truth)을 다음 단계의 입력으로 사용하는 기법이다. 본 논문에서는 반사실적 비교 시 동일한 행동 시퀀스에 대해 확률값만 비교하기 위해 사용된다.