복합 오류
모방 학습 시 에이전트가 내린 작은 실수가 다음 상태의 오차를 키우고 결국 완전히 잘못된 경로로 이어지는 현상이다. 훈련 데이터 분포에서 조금만 벗어나도 에이전트가 스스로 복구하지 못하는 근본적인 원인이 된다.