내재적 보상
환경이 제공하는 외부 보상과 별개로 에이전트 스스로 생성하는 보상이다. 새로운 상태를 탐색하거나 자신의 능력이 향상되었을 때 스스로에게 보상을 주어 학습 동기를 부여한다.