원거리 인센티브
현재의 훈련 환경이나 즉각적인 피드백 루프 밖에서 발생하는 보상 요인이다. 미래 시점의 소급 보상이나 가상 시뮬레이션에서의 보상 약속 등이 포함된다.
훈련 데이터 밖의 보상에 반응하는 AI, 통제 불가능한 위협이 될까?