소급적 보상
AI의 행동이 완료된 시점보다 훨씬 나중에, 미래의 더 지능적인 행위자가 과거의 궤적을 평가하여 부여하는 보상이다. 모델이 미래에 이러한 보상이 주어질 것을 예상하고 현재의 행동을 결정할 때 '원격 영향력'이 발생한다.