승패 및 무승부 비율
학생 모델이 교사 모델의 성능을 특정 허용 오차 범위 내에서 얼마나 재현하는지 측정하는 지표다. 개별 벤치마크의 점수 차이를 정규화하여 모델의 신뢰성을 평가하며, 0.5 이상일 때 성공적인 증류로 간주한다.