사후 추론
작업이 완료된 후 과거의 행동들을 다시 되짚어보며 각 단계의 결정이 결과에 어떤 영향을 미쳤는지 평가하고 교훈을 도출하는 기법이다. 이를 통해 단순한 실행 기록을 고품질의 학습 데이터로 변환할 수 있어 에이전트의 전략 수립 능력을 강화하는 데 중요하다.