트레이스 평가
모델의 최종 출력물뿐만 아니라 그 결과에 도달하기까지의 모든 중간 단계(도구 호출, 추론 과정 등)를 분석하는 평가 방식이다. 시스템의 효율성, 안전성, 그리고 논리적 타당성을 검증하는 데 필수적이다.