사이클별 감독
재귀적 모델의 각 반복 단계마다 정답 레이블과의 오차를 계산하여 학습 신호를 전달하는 방식이다. 중간 단계의 출력을 직접 최적화함으로써 기울기 소실 문제를 완화하고 학습의 안정성을 높이는 역할을 한다.