데이터 오염
모델 학습 과정에서 평가에 사용될 테스트 데이터가 포함되어 성능이 비정상적으로 높게 측정되는 현상이다. 코드 미공개 시 이를 확인하기 어려워 연구의 진실성을 훼손할 수 있다.