sparse-reward
에이전트가 행동을 취해도 보상이 즉각적으로 주어지지 않고 아주 가끔 발생하는 환경을 의미한다. 게임의 끝에서만 보상이 주어지는 경우 에이전트가 어떤 행동이 유익했는지 판단하기 어려워 학습이 매우 힘들어지며, 이를 해결하기 위해 보상 설계나 탐험 전략이 중요해진다.
에이전트가 행동을 취해도 보상이 즉각적으로 주어지지 않고 아주 가끔 발생하는 환경을 의미한다. 게임의 끝에서만 보상이 주어지는 경우 에이전트가 어떤 행동이 유익했는지 판단하기 어려워 학습이 매우 힘들어지며, 이를 해결하기 위해 보상 설계나 탐험 전략이 중요해진다.