본문으로 건너뛰기

reward-shaping

보상 설계

중급

에이전트가 복잡한 목표를 달성할 수 있도록 중간 단계마다 적절한 보상을 제공하여 학습 속도와 품질을 높이는 기법이다.