궤적 매칭
에이전트가 목표를 달성하기 위해 거친 일련의 단계가 의도한 설계와 일치하는지 비교하는 평가 방식이다. 최종 답변뿐만 아니라 중간 추론 과정의 정확성을 검증하는 데 필수적이다.