단계별 점수화
전체 작업의 성공 여부만 따지는 이진 평가와 달리, 작업의 세부 단계를 나누어 각각 점수를 매기는 방식이다. 에이전트가 과제의 어느 지점까지 도달했는지, 어느 단계에서 주로 실패가 발생하는지 정밀하게 분석할 수 있게 해준다.