홀드아웃 세트
최적화 과정에서 사용하지 않고 최종 검증을 위해 따로 떼어둔 데이터셋이다. 에이전트가 특정 평가 사례에만 과적합되지 않고 새로운 상황에서도 잘 작동하는지 일반화 성능을 측정하는 데 필수적이다.