다회차 대화 평가
사용자와 AI 에이전트 간에 여러 번 오가는 대화 전체를 하나의 단위로 평가하는 방식이다. 단일 응답 평가와 달리 대화의 흐름, 목표 달성 여부, 상태 유지의 일관성 등을 종합적으로 측정하여 실제 사용자 경험에 가까운 지표를 제공한다.