학습 데이터 오염
평가용 데이터셋이 모델의 학습 과정에 포함되어 벤치마크 결과가 왜곡되는 현상이다. 이를 방지하기 위해 새로 제작된(Novel) 타겟을 사용하면 모델이 이전에 본 적 없는 취약점을 실제로 해결하는지 정확히 측정할 수 있다.