평가 샘플 편향
평가 데이터셋이 모집단을 대표하지 못하고 특정 연령대에 쏠릴 때 발생하는 현상으로, 본문에서는 소규모 평가셋이 한 연령대(모드)에 과도하게 치우쳐 더 작은 평가에서 잘 맞는 모델을 과대평가했다.