사이드 스왑
동일한 토론 주제에 대해 두 모델이 찬성과 반대 입장을 한 번씩 번갈아 가며 수행하는 평가 방식이다. 특정 주제가 한쪽 입장에 유리하게 작용할 수 있는 편향을 제거하여 공정한 성능 비교를 가능하게 한다.