순환 검증
모델의 결정이 타당한지 평가할 때, 그 결정을 내린 논리나 데이터를 평가 지표로 다시 사용하는 오류이다. 자율 에이전트가 자신의 행동 결과를 스스로 평가하게 되면 실제 성능과 무관하게 항상 높은 점수가 나오는 논리적 모순이 발생한다.