쌍체 비교
두 개의 모델 응답을 동시에 제시하고 판사 모델이 어느 쪽이 더 우수한지 선택하게 하는 평가 방식이다. 절대적인 점수를 매기는 방식보다 상대적인 우위를 판단하기 쉬워 모델 간 성능 비교에 주로 사용된다.