데이터셋 누수
학습 데이터에 테스트 데이터의 정보가 의도치 않게 포함되어 모델 성능이 비정상적으로 높게 측정되는 현상이다. 이는 모델의 실제 일반화 능력을 왜곡하여 실전 배포 시 실패를 초래한다.