다회차 설득
단발성 프롬프트가 아니라 여러 번의 대화를 주고받으며 상대방의 논리에 대응하고 설득을 시도하는 과정이다. 이 벤치마크에서는 총 8회의 턴(각 측면당 4회)을 부여하여 모델이 상대의 반론을 어떻게 처리하고 논리적 압박을 유지하는지 평가한다. 단순한 문장 생성력을 넘어 고도의 전략적 추론 능력을 요구한다.