데이터 오염 확인
학습 데이터셋 안에 평가용 데이터(테스트셋)가 포함되어 있는지 검사하는 과정이다. 벤치마크 점수가 비정상적으로 높게 나오는 현상을 방지하고 모델의 실제 성능을 정확히 측정하기 위해 필수적이다.