이항 P-값
두 가지 결과 중 하나가 우연히 발생했을 확률을 측정하는 통계적 수치이다. 여기서는 모델 간의 선호도 차이가 단순한 우연이 아니라 통계적으로 유의미한 성능 차이임을 증명하기 위해 사용되었다.