중간 단계 감독
최종 결과뿐만 아니라 문제를 해결하는 중간 과정마다 정답을 제공하여 모델을 학습시키는 방식이다. 복잡한 추론을 돕기 위해 사용되지만, 때로는 모델이 논리적 사고 대신 통계적 지름길에 의존하게 만드는 부작용을 낳기도 한다.