프로세스 중심 평가
결과물인 보고서뿐만 아니라 에이전트가 정보를 검색하고 논리를 구성하는 중간 과정을 평가하는 방식이다. 이를 통해 에이전트의 우연한 정답을 배제하고 실제 추론 능력의 신뢰도와 체계성을 정밀하게 측정할 수 있다.