다단계 에이전트 추적
AI 에이전트가 최종 답변에 도달하기 위해 수행한 일련의 사고 과정과 도구 사용 기록이다. 각 단계의 논리적 타당성을 검토하여 복잡한 작업 수행 능력을 정밀하게 평가하는 지표가 된다.