오버싱킹 지표
모델이 문제를 해결하는 과정에서 인간의 표준 작업 경로와 비교하여 얼마나 불필요하거나 중복된 단계를 수행했는지 측정하는 수치이다. 에이전트의 작업 효율성을 정량적으로 평가하는 데 중요한 역할을 한다.