에이전트 기반 평가기
단순한 규칙 기반 검사가 아니라 AI 에이전트가 다른 에이전트의 행동 추적과 실행 단계를 분석하여 성공 여부를 진단하는 방식이다. 단계별 추적 가능한 진단 기능을 통해 실패 원인을 구체적으로 파악할 수 있게 한다.